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Avant-propos 


Ce livre de calcul appliqué trouve son origine dans un cours dispensé aux étudiants de maîtrise 
de physique et applications (MPA) à l’université Paris VII depuis 1984, ainsi que dans quelques 
préoccupations de recherche au laboratoire. 

Ce manuel ne constitue pas à proprement parler un cours au sens usuel du mot, et si certains 
chapitres ont des liens évidents et s’enchaînent naturellement, d’autres, plus isolés, ont été réunis 
sous forme d’annexes pour préserver au mieux l’unité, mais leur importance n’est pas secondaire. 

L'organisation de cet ouvrage vise à une présentation suffisamment concise et assimilable des 
algorithmes numériques fondamentaux, développés jusqu’à leur mise en œuvre, de telle sorte 
qu'ils soient susceptibles d’aider l’étudiant, le chercheur et l’ingénieur dans l'exercice quotidien 
de leur art : il s’agit de pouvoir obtenir des résultats numériques convenables chaque fois qu’une 
méthode analytique fait défaut. 

Pour ce qui concerne certains théorèmes très importants, nous nous sommes parfois borné 
à les énoncer sans les démontrer, le contraire eut risqué de nous éloigner de notre préoccupa- 
tion majeure : le résultat numérique: cependant, les indications bibliographiques permettent 
d'obtenir aisément ces démonstrations qui sont classiques. 

Les objectifs poursuivis se situent sur deux plans que l’on a coutume de séparer mais qui sont 
indissociables de notre point de vue : l'acquisition d’algorithmes numériques indispensable à la 
résolution de problèmes usuels et la maîtrise du traitement des données expérimentales selon la 
méthode statistique. Traiter les données de l'expérience impose l’usage de techniques numériques 
appropriées, et l'examen des résultats entachés d’erreur et d’incertitude impose l'usage de la 
statistique. La propagation des erreurs à travers les algorithmes relève d’une analyse subtile qui 
est éternellement omise tant elle est délicate. Nous avons tenté de l’effleurer et c’est une des 
raisons qui nous a poussé à développer l'étude des lois de distribution ainsi que leurs fondements 
dans une partie qui est davantage dévolue aux statistiques. 

De même qu’il est impensable de vouloir apprendre à jouer du piano la veille de donner un 
concert, de même il est impensable de vouloir apprendre l’algorithmique numérique le jour où 
le besoin s'impose. Dans les deux cas, il convient de recourir aux gammes afin d'acquérir une 
solide expérience. En calcul numérique il n’y a pas de voie royale, et aucun algorithme n’est 
capable de fournir de résultats corrects quelles que soient les données fournies. Il est toujours 
possible de mettre en défaut une procédure et d'obtenir des résultats abérrants pourvu que l'on 
s’en donne la peine... Un très bel exemple est étudié à l’occasion de la résolution des systèmes 
linéaires dépendant d’une matrice de Hilbert. 

L'expérience pratique prend alors toute sa valeur, et c’est ainsi que notre enseignement 
comporte une séance hebdomadaire de trois heures sur calculateur arithmétique. Peu importe 
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le langage et la manière, seul le «résultat correct » compte et ce n’est pas une mince affaire 
que de se faire une opinion sur les erreurs qui entachent les résultats finals. Ensuite viendront 
éventuellement se greffer les problèmes d’élégance et d’optimisation. 

En aucun cas, cet enseignement n’a pour but d'explorer et de recenser tous les algorithmes 
ayant trait à un type de problèmes. Nous avons voulu présenter ceux qui se sont montrés 
paradigmatiques soit sous langle de la simplicité soit sous l’angle de l'efficacité. Il s’agit de 
construire des programmes que nous aurons soigneusement testés, dont nous connaîtrons les 
limites et qui rempliront peu à peu notre boîte à outils. 

Pour simplifier, nous dirons que ce livre peut se subdiviser en trois parties à savoir : 


1. Études d’algorithmes numériques et leur mise en oeuvre. 
2. Analyse statistique des résultats d'expériences. 
3. Annexes, problèmes et corrigés. 


Nous l’avons déjà dit, les deux premières parties interfèrent partiellement, et c'est une des 
raisons pour laquelle nous avons renoncé à présenter un ouvrage où tout ce qui est étudié dans 
un chapitre s'appuie nécessairement sur ce qui a été établi précédemment. Par souci d'unité nous 
avons préféré regrouper les titres par centre d’intérêt. Ainsi, il nous est apparu plus intéressant 
d’avoir rassemblé l’étude des polynômes orthogonaux plutôt que d’avoir dispersé l'information 
dans différents chapitres concernant l’interpolation et l'intégration numérique. 

Il aurait été dommage de ne pas avoir abordé, ne serait-ce que rapidement, les méthodes de 
Monte-Carlo d’une part, et les problèmes mal posés d’autre part. Ces domaines illustrent bien 
la synthèse des deux premières parties, d'autant plus qu’ils s’intègrent remarquablement dans 
les préoccupations des chercheurs et des ingénieurs. Qui, en physique, n’a pas eu à résoudre 
numériquement une équation de convolution? Qui n’a pas tenté la résolution d’un problème au 
moyen d’une simulation ? 

Pour terminer nous proposons un avant-dernier chapitre constitué d’un ensemble de problèmes 
et d'exercices qui illustrent quelques usages des méthodes qui ont été présentées ; ils servent 
également à éclairer quelques points de théorie qui seraient venus alourdir le cours s’ils avaient 
été intégrés dans les divers chapitres : on montre par exemple que le coefficient de conformité 
de Pearson obéit bien à une loi du x?. Le dernier chapitre donne les solutions des problèmes 
présentés. 

La plupart des chapitres font l’objet d’une illustration et se terminent par des programmes 
écrits dans le langage C : il s’agit du langage de base qui assure la portabilité. Ce point de vue 
s'explique par la facilité qu’il y a à changer de langage : Fortran, Pascal, etc., sans avoir grand 
chose à modifier dans le programme source. On n’est pas obligé de partager ces vues, mais il est 
très facile de modifier les programmes proposés pour qu’ils apparaissent moins « archaïques ». 

Pour en finir avec les algorithmes choisis et les programmes présentés, nous dirons qu’ils 
sont fournis sans garantie d'aucune sorte malgré le grand soin porté à ce travail. Ils peuvent 
comporter des imprécisions voire des imperfections, à ceci s’ajoute le fait qu'aucun algorithme 
n’est irréprochable dans la mesure où il est toujours possible de trouver des valeurs numériques 
qui le mette en défaut. 

Bien sûr, nous formons le vœu que cet ouvrage puisse apporter une aide solide aux étudiants, 
ingénieurs et chercheurs pour lesquels il constituera un outil dont le rôle favorise la réalisation 
de sa propre boîte à outils. 

La rédaction d’un ouvrage ne se réalise jamais dans l'isolement, et il ma fallu bien des oreilles 
attentives, bien des lecteurs vigilants, bien des conseillers éclairés. L’instant est venu de remercier 
tous ceux qui, à quelque titre que ce soit, wont apporté une aide inconditionnelle, je citerai 
par ordre alphabétique : Claude Bardos, Jean Bornarel, Jacques Gacougnolle, Patricia Guilpin, 
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Michel Jacques, Claude Marti, Yvan Simon ainsi que l’équipe de physique théorique de Chaouqui 
Misbah. 

Pour terminer, j'ajouterai une mention particulière à EDP Sciences qui m’a offert un contexte 
de travail optimum afin d’obtenir la meilleure réalisation possible. 


Christian GUILPIN 
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1 | Généralités sur le calcul 
numérique 


Le calcul numérique est une branche des mathématiques appliquées qui étudie les méthodes 
pratiques destinées à fournir des solutions numériques aux problèmes formalisés dans le langage 
des mathématiques pures. La plupart du temps, ce sont les ingénieurs et les chercheurs qui se 
trouvent concernés par l’usage de ces méthodes pratiques, car ce sont en définitive les nombres 
qui vont retenir leur attention. Face à un jeu d'équations plus ou moins complexes, ils devront 
obtenir un ensemble de valeurs numériques qui pourra servir par exemple soit à la réalisation d’un 
édifice ou d’un prototype, soit à la confrontation des résultats expérimentaux et théoriques etc. 


1. La notion d’algorithme en calcul numérique 


Un algorithme est un procédé de calcul qui ne met en œuvre que des opérations arithmétiques et 
logiques. L’étymologie de ce mot est arabe et c’est une altération du nom du mathématicien Al- 
Khwârizmi (18127), probablement sous l'influence du mot grec (repris par les latins) 6 aptfués, 
le nombre. 

Quoi qu'il en soit, c’est une dénomination commode qui sert à désigner l’ensemble des 
opérations qui interviennent au cours d’une démonstration conduisant à l’énoncé d’un théorème. 
Cependant sa portée ne dépasse pas celle de la « prose que chacun fait sans le savoir », et en aucun 
cas cette définition ne permet de donner une manière de construction des algorithmes. Il s’agit 
donc d’un concept commode mais peu fécond qui sert à désigner un certain type d'organisation 
de propositions à caractère mathématique. Sans que rien ne soit changé, il est tout à fait possible 
de remplacer ce mot par procédé de calcul, technique de calcul, procédure... 

Pour illustrer ce concept, on peut évoquer, par exemple, la technique de résolution des 
équations du deuxième degré à coefficients réels à condition toutefois d'admettre que l’on 
dispose outre les quatre opérations fondamentales (addition, soustraction, multiplication et 
division) de l'opération racine carrée. L'examen des mathématiques montre que le nombre 
d'opérations proposées dans un algorithme peut être infini (mais dénombrable), c’est le cas 
des développements en série de fonctions : série entière, série de Fourier, etc. 

Le concept d’algorithme en calcul numérique est quelque peu plus restrictif : le nombre 
d'opérations élémentaires arithmétiques et logiques est obligatoirement fini. En outre, cela 
implique que l’on ne peut manipuler que des nombres admettant une représentation finie ce 
qui conduit à effectuer des troncatures et des arrondis au cours des opérations successives. Cette 
remarque en apparence triviale doit pourtant être présente à l’esprit lorsque l’on fait usage d’une 
machine arithmétique (mais aussi du calcul manuel...) : la première division venue, la première 
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racine carrée venue ont toutes les chances d’introduire un nombre dont la représentation impose 
une infinité de chiffres significatifs, il faudra les tronquer... 

La connaissance de la manière dont les nombres sont représentés dans la machine utilisée 
est fondamentale en ce sens qu’elle permet l'estimation de la précision attachée aux résultats 
d’un calcul. Dès lors, on comprend très bien que la recherche d’une grande précision imposera 
une grande taille de mots-machine et par conséquent un grand temps de calcul. En revanche, 
une faible précision n’imposera qu’une petite taille du mot-machine ainsi qu’un faible temps de 
calcul. Le choix retenu est en général un compromis entre ces deux situations extrêmes. 

Cette dernière étape intervient lors de l'évaluation de l'incertitude qui entache les résultats 
d’un calcul, mais ce n’est pas la seule source. Le problème général de l'évaluation des incertitudes 
et erreurs est délicat qui plus est lorsque l’on fait usage d’une machine; nous l’aborderons un 
peu plus en détail dans quelques paragraphes. 


2. Le calcul numérique ne concerne que les nombres entiers 


Ce n’est pas une boutade, et il faut bien admettre que l’on ne peut manipuler (au sens 
étymologique) que des représentations finies. La représentation dite en virgule flottante éclaire 
ce point de vue car en fait elle traite de nombres ayant une certaine quantité fixe de chiffres 
significatifs (agrémenté d’un facteur de cadrage appelé exposant) et dans la réalité, à chaque 
opération élémentaire sur les nombres il y a une opération de cadrage suivie d’une opération 
arithmétique sur les nombres entiers, elle-même suivie éventuellement d’une opération de 
troncature ou d’arrondi. 

Cette conception n’est pas tellement restrictive en soi, car les seules opérations arithmétiques 
pratiques que l'Homme est susceptible de réaliser ne peuvent que concerner les nombres 
admettant une représentation finie de symboles (chiffres significatifs) donc en fait des entiers. 
Pour ce qui concerne les machines arithmétiques, les deux représentations, entière et flottante, ne 
doivent pas masquer la réalité et il faut voir là uniquement deux représentations commodes. En 
fin de chapitre, on trouvera un paragraphe traitant de quelques représentations assez générales. 


3. Le calcul numérique traite du problème pratique 
de l’approximation de fonctions explicites ou implicites 


Un problème d'analyse se trouvant modélisé dans le langage des mathématiques pures, la 
première préoccupation consiste à rechercher la solution sous forme littérale à l’aide des fonctions 
connues qui sont les polynômes et les fonctions transcendantes élémentaires. On peut se poser 
la question de savoir si cette façon de concevoir est toujours possible. 

Tous les problèmes ne sont pas algorithmiquement solubles, et force est de répondre non à la 
question posée. Pour s’en convaincre, il suffit de considérer un exemple, sous l’angle de l’histoire, 
qui illustre cette difficulté : la recherche des racines d’un polynôme de degré quelconque à 
coefficients réels. 

Si l’équation du deuxième degré est connue depuis l’Antiquité, on peut dire qu’il revient à 
AI-Khwârizmi (fin vme, début 1xe) et à Luca Pacioli (14457-15147) le fait d’avoir raffiné les 
solutions. 

L'école italienne de Bologne s'attaque à l'équation du troisième degré: on retiendra à son 
propos les noms de Tartaglia (1500?-1557), de Cardan (1501-1576) qui parvinrent à la solution 
au travers de défis et de provocations qui semblaient être coutumiers à cette époque. Signalons 
toutefois que les bases de l'étude sont dues à Del Fero (1465?-1526). 
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Ensuite l'équation du quatrième degré fut abordée et résolue par Ferrari (1522-1565) qui fut 
un élève de Cardan. Plus tard, les mathématiciens s’intéressèrent tout naturellement à l'équation 
du cinquième degré et les recherches furent très riches d’enseignements dans la mesure où, selon 
toute vraisemblance pour la première fois dans l’histoire des sciences, le travail conduisit à 
l'énoncé d’un résultat négatif. 


1. En 1608, Rothe (?-1617) émit une proposition selon laquelle toute équation algébrique 
de degré n possédait n racines réelles ou complexes, et Gauss (1777-1855) en effectua la 
démonstration rigoureuse en 1799. 

2. Cette même année Ruffini (1765-1822) affirma l'impossibilité formelle d'obtenir la résolution 
des équations algébriques de degré supérieur à quatre. Il fallut attendre la publication des 
travaux d’Abel (1802-1829) pour obtenir la démonstration définitive de la proposition de 
Ruffini (1826). 


Ce résumé de l’histoire des équations algébriques nous mène à deux types de remarques : 


Remarque 1 : Le fait de poser un problème dont la solution existe n’est pas suffisant pour 
permettre d’exhiber effectivement ladite solution selon des moyens donnés. On peut se rappeler 
à ce propos le problème de la trisection de l’angle qui n’est pas algorithmiquement soluble si les 
moyens de construction autorisés sont la règle et le compas. 

Aujourd’hui, on sait que les problèmes que l’on peut se poser sont de trois types à savoir : 


a. les problèmes algorithmiquement solubles, l'équation du deuxième degré par exemple ; 

b. les problèmes algorithmiquement non solubles, par exemple la quadrature du cercle à l’aide 
de la règle et du compas ; 

c. les problèmes indécidables pour lesquels on ne peut rien démontrer. Du reste, dans une 
axiomatique donnée, on sait qu’il existe des propositions vraies que l’on ne peut pas 
démontrer, à condition de considérer toutefois que les axiomes de l’arithmétique ne sont 
pas contradictoires (cf. Gödel (1906-1978)). 


Remarque 2 : Ce n’est pas parce qu’un problème est algorithmiquement insoluble que l’on 
n’est pas en mesure de proposer une solution approchée — généralement avec une précision 
fixée à l'avance — et c’est justement la raison d’être du calcul numérique que de fournir de 
telles solutions ; par exemple, on verra comment calculer les racines d’un polynôme de degré 
quelconque à coefficients réels. 


En terminant ce paragraphe, nous remarquerons que les problèmes de calcul numérique sont 
uniquement des problèmes d’approximation de fonctions au sens le plus large. Souvenons-nous 
d’une des premières équations différentielles que nous avons rencontrée en Physique, il s’agit 
de l’équation du pendule pesant assujetti à osciller dans un plan. On écrit traditionnellement 
l'équation à laquelle obéit son mouvement : 


d?4(t) 
dt? 


où 0(t) est l’angle que le pendule fait avec la verticale à un instant donné, w étant une constante 
dépendant de la longueur du pendule et de l’accélération. Alors, on apprend que l’on ne peut 
pas obtenir la solution sous forme littérale (t, 0o, 4, w?) à l’aide des transcendances usuelles (46 
et 0ġ sont les conditions initiales sur l’angle et la vitesse angulaire). Pourtant, le théorème de 
Cauchy-Lipschitz nous permet d'affirmer l'existence et l’unicité d’une telle solution qui est de 
surcroît une fonction analytique. 

La tradition veut également que l’on ne s’intéresse qu’au cas des petits angles pour lesquels on 
peut écrire le développement de sin O(t) au premier ordre. Alors, dans ce cas particulier, on sait 


+w? sin b(t) = 0, 
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obtenir la solution sous forme littérale. Cependant, chacun sait que les pendules sont capricieux, 
et tous n’ont pas le bon goût de vouloir limiter l’amplitude de leurs oscillations. C’est le rôle du 
calcul numérique que d'apporter une réponse à ces types de problèmes et l’on verra chaque fois 
de quelle manière. 


4. Solutions littérales et solutions analytiques 


À propos du pendule, nous avons dit que la solution (t, 6l, w?) ne pouvait être exprimée sous 
forme littérale c’est-à-dire que l’on ne pouvait pas donner une expression formelle en fonction 
des transcendances usuelles et des polynômes. Cela ne signifie nullement que la solution n’est pas 
une fonction analytique. À ce sujet, rappelons qu’une fonction est dite analytique lorsqu'elle est 
développable en série entière, que la fonction soit réelle ou complexe, que les arguments soient 
réels ou complexes. D'ailleurs, sans préjuger de la suite, on peut ajouter que le calcul numérique 
fait amplement appel aux développements en série dans de nombreuses méthodes, et d’une 
façon tout à fait générale, on peut affirmer que toutes les solutions numériques sont des valeurs 
numériques de fonctions analytiques. En résumé, pour éviter tout abus et toute ambiguïté, il 
convient de distinguer l’expression formelle d’une fonction avec son expression analytique. 


5. Que sait-on calculer rigoureusement ? 


Comme nous ne pouvons traiter que de nombres admettant une représentation finie de chiffres 
significatifs, seules l'addition, la soustraction et la multiplication donneront des résultats 
rigoureux lors de l’exécution des différentes opérations (encore avons-nous fait abstraction des 
réels problèmes de la taille réservée pour représenter les nombres). La première division venue 
a statistiquement toutes les chances d'introduire un résultat comportant un nombre infini de 
chiffres significatifs. 

Sur le plan du calcul des fonctions, seuls les polynômes (dont le degré est évidemment fini) 
sont susceptibles d’être calculés rigoureusement (ou avec une précision souhaitée à l’avance 
dans la mesure où le calcul peut faire intervenir la division). Là repose le grand intérêt des 
développements en série (de MacLaurin (1698-1746) et Taylor (1685-1731)) qui fournit une 
expression calculable sachant que l’on se fixe à l’avance une précision donnée et sachant que l’on 
peut majorer convenablement l’expression du reste de la série. Au passage, il est bon de noter 
que l’on sait en général réaliser une opération formelle importante : la dérivation, indispensable 
au calcul des coefficients du développement en série. 

Considérons une fonction f(x) régulière c’est-à-dire continue, dérivable autant de fois que l’on 
veut dans un domaine D contenant a et a + h, son développement en série de Taylor s'écrit : 


‘(a "(a (la 
jern = ro) On O o 


où Rn+1 est l'expression du reste lorsque l’on tronque par nécessité le développement à l’ordre 
n. Ce reste s'écrit : 


h°+...+ 


h” + Ru 


FDE hotl 
(n +1)! 
où € est un nombre compris entre a et (a+ h). 


Il est quasiment impossible de connaître £ et, conformément à l’usage, on cherche un majorant 
de Rn+1 dans l'intervalle (a,a + h). À ce propos, rappelons que si R,:1 tend vers zéro quand 


Ra = 
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n tend vers l'infini, pour une fonction pourvue d’une infinité de dérivées, le développement de 
Taylor devient une série entière appelée série de MacLaurin. 

En définitive, nous ne savons calculer que peu de choses avec une extrême rigueur, mais les 
polynômes en font partie, et cela leur confère un rôle particulièrement intéressant en calcul 
numérique. À bien y réfléchir, cela met en relief une autre facette du théorème d’approximation 
de Weierstrass (1815-1897) qui date de 1885 et sur lequel nous aurons le loisir d’insister 
ultérieurement à propos de l’interpolation (chapitre 6). 


6. Les erreurs et les incertitudes 


Un algorithme donné permet d'obtenir des résultats numériques qui, malheureusement, sont 
entachés d'erreurs dont les sources proviennent d'origines différentes. 

Tout d’abord, il faut évoquer l’erreur au sens trivial du terme, c’est-à-dire la méprise; elle 
mérite quelques commentaires tout simplement parce qu’elle est polymorphe et qu’elle n’est pas 
toujours évidente à détecter. Cela peut aller de l'erreur de méthode ou d’algorithme à la simple 
faute de copie ou de transcription. Que d’ennuis liés à la transmission de mauvaises données, 
alors que le programme est tout à fait convenable. C’est la raison pour laquelle, derrière toute 
instruction de lecture, il est impératif de réécrire la donnée communiquée et c’est du reste une 
bonne façon de la voir figurer sur la feuille de résultats. 

Ici, comme ailleurs, il n’y a pas de règles universelles qui permettent d'éviter la bévue ; 
cependant, lors de la phase de mise au point, évitons les compilateurs tolérants, vérifions que 
nous retrouvons les résultats connus liés à certains types de problèmes, sollicitons le jugement 
éclairé d’un collègue... 

Maintenant, dans l'hypothèse où l'algorithme retenu est adéquat, et que sa programmation 
apparaît sans faille (ce qui implique de surcroît que l'algorithme soit adapté aux données 
traitées), on peut envisager l'étude des erreurs entachant les résultats numériques obtenus. 


6.1. Erreurs à caractère mathématique 


La différence entre la solution strictement mathématique et la solution approchée fournit un 
terme d'erreur : c’est le cas fréquemment rencontré lors de l’étude des séries infinies, des suites 
infinies, des produits infinis, etc. Dans tous les cas classiques, on arrive à connaître un majorant 
raisonnable des restes qui sont abandonnés. 


6.2. Erreurs liées à l'exécution des calculs 


Les données numériques confiées à une machine ont deux origines : ce sont des nombres d’origine 
strictement mathématique (calcul d’une intégrale par exemple) ou des données provenant de 
mesures lesquelles sont déterminées dans un intervalle (autrement dit à une certaine précision 
près), c’est ce que le physicien dénomme incertitude. Quelle que soit leur origine, les données 
comportent une erreur ou une incertitude, car même dans le premier cas, les opérations de 
conversion et d’arrondi introduisent statistiquement une erreur. 

La machine traite ces données selon un certain algorithme et procède à chaque étape 
élémentaire à une opération d’arrondi. L’arrondi est une opération qui consiste à ajouter à 
la mantisse du nombre la valeur 0,5 puis à tronquer le résultat, ce qui permet de diviser les 
erreurs machine par deux. 

Après l’exécution de tous les calculs, on doit se demander inévitablement quelle est la précision 
du résultat final. Il s’agit de voir comment l'incertitude finale a été propagée au cours de toutes 
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les opérations d’arrondi. Le problème n’est pas si simple que cela et dépend essentiellement de 
la manière dont l'algorithme propage les erreurs indépendamment des calculs effectués. 


7. Un problème difficile : la propagation des erreurs en calcul automatique 


Si les calculs font intervenir des fonctions transcendantes usuelles que l’on trouve sur toutes 
les machines, il faut alors avoir recours au manuel du fabricant de logiciels pour connaître 
l'incertitude attachée à l’usage de telle ou telle fonction, incertitudes qui dépendent, en règle 
générale, de la taille de l'argument. Nous faisons allusion plus spécialement aux fonctions 
dites fonctions de bibliothèque : sinus, cosinus, tangente, arc sinus, arc cosinus, arc tangente, 
exponentielle, logarithme, racine carrée (annexe E)... Toutefois les erreurs affectant les résultats 
{fournies par le fabricant) ne sont pas la majoration de l’erreur relative ou absolue mais plus 
simplement l’écart quadratique moyen ; cela fournit une valeur bien plus raisonnable de l’erreur 
qui serait sans cela toujours exagérément surestimées. Cette conception est tout à fait convenable 
dans la mesure où l’on peut supposer que les erreurs obéissent à la loi de Gauss-Laplace, mais 
cette hypothèse admet des limites qu’il convient de ne pas franchir et nous en verrons un exemple 
un peu plus loin. 

En résumé, les calculs sont réalisés au moyen d'opérations introduisant des arrondis et de 
fonctions de bibliothèque affectées d’une précision limitée. Que peut-on conclure quant à la 
précision des résultats finals? Il n’est pas possible d'apporter une réponse à la question ainsi 
posée car les erreurs dépendent de la manière dont l'algorithme les propage et la limite supérieure 
de l'erreur finale n’est pas nécessairement un majorant de la somme de la borne supérieure du 
module des erreurs évaluées à chaque opération élémentaire. Pour s’en convaincre, il suffit de 
procéder selon cette technique et l’on s’apercevra bien vite que cette façon de concevoir les 
incertitudes se révèle très exagérée et très surestimée ; en effet, il n’y a aucune chance pour que 
toutes les opérations du calcul soient systématiquement l’objet d’une erreur maximum. 

L’algorithme propage des erreurs, mais pour bien situer le problème disons que, de ce point 
de vue, on rencontre deux types d’algorithmes : ceux qui font appel à des calculs cumulatifs 
reposant sur l’addition (au sens large) et les calculs itératifs reposant sur la répétition du calcul 
avec chaque fois une nouvelle valeur donnée par le précédent tour. 


7.1. Les calculs itératifs 


Comme nous l’avons dit ce sont des calculs répétitifs que l’on limite nécessairement à un certain 
ordre, et qui consistent à réintroduire dans le calcul la dernière valeur calculée. Le plus souvent, 
la procédure n’a d’intérêt que dans la mesure où la suite générée est convergente. 

La limite obtenue ne dépend alors que de la précision de la machine utilisée (représentation 
des nombres, fonctions de bibliothèque, ...). Cependant, il convient d'ajouter que le cumul des 
erreurs au cours d’un tour de calcul interviendra au niveau de la vitesse de convergence du 
processus. 


Exemple de calcul répétitif — Calcul de la racine carrée d’un nombre positif N. 
Désignons par ao une première approximation de v N et par eo l'erreur liée à cette estimation. 
On a la relation : 


VN = ao + 60. 


Nous allons essayer d'obtenir une approximation de es. Pour cela développons au premier 
ordre l’expression : 


N = (ao + eg). 
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On obtient : 
N = ao(ao + 265), 
expression dans laquelle eo est remplacée par ef qui en est une approximation. On déduit : 
eo = (N/ao ~ ao)/2, 
soit encore : 
a = ag + eh = (N/ao + ao)/2. 


La somme ao + ef, constitue une meilleure approximation que ap sous réserve toutefois que 
le développement soit convergent. Dans ce dernier cas, rien ne nous empêche de recommencer 
les calculs avec la dernière approximation évaluée a; (itération), et ceci jusqu’à ce que l’on ait 
obtenu le meilleur résultat que la précision de la machine puisse permettre d'obtenir. De toute 
façon, il faudra choisir un critère tel que le nombre d’itérations soit fini, encore faut-il que la 
suite de nombres générée soit convergente. 

Pour s’assurer de cette convergence, il faut et il suffit que : 


le;| < la;|. 


Donc pour débuter les itérations on peut prendre ao = N par exemple. L'erreur sur le calcul 
dépend de la limite de l'erreur mathématique e; qui ne tend pas vers zéro du point de vue 
numérique. el, admet une limite non nulle e parce que nous avons affaire à des erreurs de 
troncature. Cela conditionne la précision de la valeur finale, mais cela peut avoir pour effet de 
donner une suite (ax) qui, lorsque k est grand, fournit alternativement deux valeurs limites. Nous 
aurons l’occasion d'examiner plus en détail ce problème en étudiant les racines des équations. 

Dans cette classe de problèmes où les erreurs ne sont pas cumulées dès le début de l'algorithme, 
on peut intégrer d’autres types d’algorithmes qui relèvent de la même analyse parmi lesquels on 
peut citer la dichotomie (cf. chapitre 4). 


7.2. Les calculs cumulatifs 


Il s’agit de calculs dont le résultat dépend de tout l’ensemble des calculs intermédiaires. Les 
exemples les plus immédiats concernent la somme d’une série numérique ou encore le calcul d’une 
intégrale. Le résultat définitif dépend évidemment, toujours du point de vue de la précision, du 
nombre de termes calculés et du nombre de chiffres significatifs dont la machine dispose. À cet 
égard, une méfiance toute particulière doit être manifestée lorsque l’on traite des séries lentement 
convergentes ou lentement divergentes, car il est possible d'obtenir à peu près n'importe quoi, 
l'erreur pouvant devenir quasiment infinie. L'exemple le plus connu qui illustre parfaitement ces 
propos repose sur la série harmonique qui est très lentement divergente. 

Le calcul effectif de la série divergente 37%_,1/n donne toujours un résultat fini en faisant 
usage des machines usuelles, car la somme partielle Sp obtenue par sommation des p premiers 
termes qui apportent effectivement une contribution à la somme est toujours très inférieure à 
la taille du plus grand nombre représentable dans lesdites machines. Pour fixer les idées, si la 
précision relative fournie par la machine est 107 *, le nombre p sera obtenu lorsque : 


1/(p — 1)/Sp < 10 À. 
Autrement dit le terme (p + 1) ne peut plus modifier la somme partielle déjà calculée, il en 


sera de même des termes suivants qui sont encore plus petits. 
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Si la série avait divergé plus rapidement, nous aurions pu être alerté par un dépassement 
de capacité qui aurait arrêté l’exécution des calculs c’est-à-dire qu’à partir d’un certain rang la 
somme partielle aurait dépassé le plus grand nombre représentable en machine, malheureusement 
il n’en a rien été. Ces considérations sur les séries attirent deux autres remarques : 


1. Un dépassement de capacité signalé ne signifie pas obligatoirement que l’algorithme utilisé 
est divergent, mais tout simplement qu’au cours du calcul la somme partielle s’est montrée 
supérieure au plus grand nombre représentable. Il est facile de donner un tel exemple en 
considérant le développement de exp(x) : 


(2) TP, 
exp(x) = x Leu PR 
P 273] 


Utilisons ce développement toujours convergent (rayon de convergence infini) pour calculer 
exp(—1 000). Nous savons que cette valeur est très petite, mais bien que le développement 
de exp(x) soit absolument convergent le calcul de la série alternée va poser des problèmes 
quasiment insurmontables. Grosso modo la somme partielle va croître jusqu’à ce que n! 
l'emporte sur z”, donc lorsque 1000” ~ n!. En passant aux logarithmes puis en faisant 
usage de la formule de Stirling log.(n!) = nlog.(n}) — n, on aboutit au résultat suivant : 


nlog,(1000) = nlog,(n) — n, 


d’où 


loge (x) = 


On obtient n en écrivant que n/1000 = e (e est la base des logarithmes népériens). Soit n = 
2718. Il west peut-être pas inutile d’insister sur la taille immense des nombres intermédiaires 
qui doivent être calculés (2718! ~ 108154) et qui dépasse de très loin la capacité des mots- 
mémoire les plus optimistes. Cet exemple montre à l’évidence que les fonctions de bibliothèque 
ne sont certainement pas calculées au moyen de développements de ce type. Nous avons 
consacré les annexes C, D, E, à la technique de calcul des fonctions de bibliothèque. 

2. Le calcul numérique n'exclut pas de ses méthodes l’usage de certaines séries divergentes 
(encore appelées séries semi-convergentes) : on verra des applications lors de l’étude des déve- 
loppements asymptotiques et lors de l’étude de l’epsilon-algorithme appliqué aux fonctions 
admettant un prolongement analytique (chapitre 2). 


Revenons un instant sur les séries lentement convergentes ; elles constituent un piège redou- 
table car rien ne permet de se défier du résultat si ce n’est justement un calcul d'erreur. 
Nous pensons plus particulièrement aux séries de Fourier (1768-1830) lorsque les coefficients 
décroissent comme 1/n. Dans ce domaine, rien n’est simple car la majoration abusive des erreurs 
conduit tout aussi inévitablement à pénaliser voire à rejeter des résultats qui pourraient être 
acceptables. 


Un exemple de calcul d'erreur sur la somme d'une série convergente — Dans le simple but 
de supprimer les cadrages des nombres intermédiaires, et donc de raisonner plus facilement sur 
les erreurs absolues, nous allons examiner en détail le calcul d’une série banale et connue dont 
la somme vaut l'unité, soit : 


TR e E EE 1 4 
1x2 3x4 4x5 nx (n+1) 


"2x3. 
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Comme 
1 o1 1 
n(n+1) n (n+1)' 
on voit que la somme partielle limitée au m° terme s'écrit : 
1 
Amk (m +1) 

En effectuant un passage à la limite quand m devient infini, on en conclut que la limite de 
la série est égale à 1. Ce n’est pas l'examen mathématique de cette série qui va retenir notre 
attention, mais uniquement le calcul numérique effectif ainsi que lerreur qui en résulte. 

Quand on limite la somme aux m premiers termes, on peut majorer l'erreur de troncature de 
cette série, c’est une erreur mathématique qui est majorée par le premier terme abandonné de 


la série convergente alternée : 


i 1 
~ (m+1) | 

À présent supposons que les calculs soient réalisés sur une machine qui travaille avec des 
nombres représentés sur 5 octets. Chaque étape du calcul introduit une erreur de l’ordre de 


(cf. 89) : 


Em 


e, = 1079332 
p , 

Comme il n’y a pas d'erreur sur les multiplications (pas de troncature), seules sont prises 
en compte les erreurs sur les inversions et sur les additions : soient au total 2m opérations 
susceptibles d'apporter une contribution à ce que nous appellerons l'erreur globale Eg. On peut 
majorer E, : 

Eg = 2mes. 


Nous donnons ci-dessous un tableau (Tab. 1.1) où sont portés m, Sm, l’erreur globale, l'erreur 


1 
m+1 |’ 


[1—S— 4l est un terme qui représente les erreurs cumulées au cours des opérations réalisées 


en machine, ce terme est désigné par erreur réelle dans le tableau. Nous avons choisi de faire 
varier m de 10000 en 10000 jusqu’à 50000, puis de passer à la valeur 100 000. 


statistique et |1 — S — 


Tableau 1.1. 
m S err. globa. 10° err. stat. 10° err. réelle 10° 
10 000 0,999 900 0,931 0,475 0,329 
20 000 0,999 950 1,86 0,672 0,440 
30 000 0,999 967 2,79 0,822 0,255 
40 000 0,999 975 3,72 0,950 2,88 
50 000 0,999 980 4,66 1,06 2,30 
100 000 0,999 991 9,31 1,502 77,0 


Il est facile de constater que les erreurs globales Æ, majorées a priori ne représentent pas 
du tout la réalité, et pour m = 50000, Æ, est environ 500 fois trop grand. On en conclut que 
cette manière de concevoir les erreurs n’apporte rien et surtout n’est pas réaliste. Il est bien 
préférable de raisonner en termes de probabilité. Du reste, la probabilité pour que l'erreur soit 
effectivement égale à E, est pratiquement nulle. 


25 


MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ 


8. Réexamen des erreurs du point de vue statistique 


Supposons que l’on utilise une machine qui travaille sur des mantisses de n chiffres significatifs. 
On va alors raisonner sur la valeur absolue de la mantisse considérée comme un nombre entier. 

Faisons l’hypothèse que l’erreur de troncature puisse être considérée comme une variable 
aléatoire continue que l’on désigne par X à valeur sur (0,1). 


8.1. Cas où la distribution des X peut être considérée comme rectangulaire 


On peut aisément calculer les caractéristiques de la variable aléatoire X. On calcule d’abord la 
moyenne : 


sk 
m= (X) = f XAX = 0,5, 
0 


puis l'écart quadratique moyen g? : 


1 
o? = Î (X — m)?dX = 0,0833, 
0 


d’où l’on tire o = 0,288 7. 

À chaque opération, on peut associer à l'erreur une variable aléatoire X. S'il y a N opérations 
dans la procédure globale et si l’on suppose que les erreurs sont indépendantes, l’erreur totale 
sera la variable aléatoire : 


Y=) X;. 


j=1 
D’après le théorème central limite, Y est une variable aléatoire gaussienne de moyenne m et 
d'écart quadratique moyen ø : 


o? = No? 
ce qui donne en définitive une mesure de l'erreur donnée par l'écart type : 
Oy = 0,288 7V N. 


o4 constitue en général une bonne estimation de lerreur et nous rappelons à ce sujet que la 
probabilité pour que l’erreur soit inférieure en module à o, est 68%, à 20, est 95% et à 30, est 
99,7%. 

En réalité la variable aléatoire X™ prend ses valeurs sur l'intervalle (0, 0,5) puisque la machine 
effectue non pas des troncatures mais des arrondis, ce qui divise chaque erreur élémentaire par 
2. Il s'ensuit que : m = (X) = 0,25, a? = 1,042 10 ?, soit o = 0,102, et a, = 0,102VN. 


8.2. Cas où X n'est plus à distribution rectangulaire 


Reprenons l’exemple précédent et cherchons à calculer la somme de la série « à la précision de la 
machine », c’est-à-dire que l’on va arrêter les calculs lorsque $,/(n + 1)/(n +2) sera plus grand 
que 109332 si l’on dispose de 4 octets pour représenter la mantisse. 

À partir d’un certain rang K < n, la division va introduire une erreur systématique qui va 
garder le même sens très longtemps. La distribution ne sera plus du tout rectangulaire et les 
estimations effectuées au moyen des erreurs gaussiennes deviennent caduques. 

Grosso modo, la précision optimum est obtenue pour une valeur de n voisine de 100000 
que nous avons portée dans le tableau. On voit très bien que, pour ce type de problèmes, les 
grandeurs statistiques ne sont plus des estimateurs acceptables de l’erreur, cependant elles le 
demeurent pour n allant jusqu’à 50 000 environ. 
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9. Sur la représentation des nombres en machine 


9.1. Les nombres entiers 


Pour les entiers positifs la représentation retenue est la représentation binaire pure et pour les 
entiers négatifs la représentation binaire en complément à deux. Nous allons montrer de quelle 
façon se réalisent ces représentations sur une machine travaillant sur des mots-mémoire de k 
bits (bit est la contraction de binary digit signifiant chiffre binaire). 

Le nombre de configurations différentes susceptibles d'être obtenues est alors 2%, on peut 
donc représenter 2° nombres entiers en binaire. La plupart du temps il est convenu d'utiliser 
le premier bit à gauche pour exprimer le signe du nombre et l’on adopte la valeur zéro pour 
désigner un nombre positif et la valeur un pour désigner un nombre négatif. 

En ce qui concerne les nombres négatifs, on préfère utiliser la représentation en complément 
à deux qui permet alors d’effectuer l’addition des nombres et non la soustraction. Ajoutons que 
l’on gagne un chiffre dans la représentation car il n’y a qu’une seule configuration pour zéro 
alors qu’il y en aurait deux en signant les nombres négatifs : une pour les positifs et une pour 
les négatifs. 

Si l’on se limite au point de vue opératoire, la représentation en complément à deux consiste 
à écrire le nombre en binaire pur, puis à changer le symbole zéro en symbole un et le symbole 
un en symbole zéro, et enfin à ajouter un. Ainsi, de cette façon, on représente les nombres sur 
l'intervalle fini (—2%71, +2k-1 — 1). 


Exemple — On suppose que le mot-mémoire a la taille d’un octet (8 bits), donc on peut 
représenter 256 configurations différentes, soit encore les nombres de —128 à +127. 

On désire réaliser l'opération c = a + b avec a = 57 et b = —36. Les représentations binaires 
sont les suivantes : 


a 00111001 lb] 00100100 
b 11011100 (a 100010101 
report 


On s’aperçoit alors, qu’à l’exécution, il y a un dépassement de la capacité du mot-mémoire. 
La plupart des compilateurs masquent ce dépassement de capacité (report) et l’on génère des 
nombres entiers modulo 2%. Cette propriété sera exploitée pour générer des nombres pseudo- 
aléatoires (cf. chapitre 19). 


9.2. Les nombres décimaux ou flottants ou réels 


La représentation entière ne permet pas une large dynamique et se trouve mal adaptée à la 
représentation des nombres de grande taille (grand module de l’exposant). Pour fixer les idées, 
considérons un nombre de l’ordre de 101%, Il faudrait des mots-mémoire constitués de 300 à 350 
bits pour le représenter en binaire pur ce qui est prohibitif dans la mesure où statistiquement 
peu de nombres aussi grands sont utilisés, alors que toutes les opérations arithmétiques devront 
porter sur tous les bits sans exception ; cela montre que la machine passerait le plus clair de son 
temps à travailler pour rien... Tout bien considéré, même si la taille de la mémoire devait être 
considérable, le problème des très petits nombres fractionnaires resterait entièrement posé. 

En définitive, il s’agit de trouver un compromis acceptable entre la précision de la repré- 
sentation et la taille du mot-machine, ce qui a une incidence directe sur le temps d'exécution 
des opérations et la taille de la mémoire centrale. Avant d’envisager la manière de stocker un 
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nombre en machine, il nous faut parler des nombres normalisés qui permettent d'optimiser la 
représentation. Un nombre, quel qu’il soit, s'exprime soit dans le vocabulaire écrit courant, soit 
au moyen d’une représentation symbolique écrite dans une base donnée (à l’aide de chiffres) ; 
c’est évidemment la seconde option qui est utilisée pour représenter l'information codée. Ceci 
peut apparaître comme une évidence, il n’en est rien; pour s’en convaincre il suffit d'écrire 
deux nombres en chiffres romains et d'en effectuer la division. On s'aperçoit sans difficulté que 
l'écriture en chiffres romains n’est pas bien adaptée à la réalisation effective de cette opération. 
Un nombre peut toujours être représenté dans une base B quelconque selon l'expression : 


N = 5 BB" avec {8k} = (0, 1,2,...(B — 1)). 


n=mĖm] 


On remarque que m1 et m2 sont des nombres entiers finis dès qu'il s’agit de calculs effectifs 
(positifs, négatifs ou nuls). On peut encore écrire : 


m2 
N= | 5 ggr ) pran 


nm 


Cette dernière représentation est dite normalisée à condition toutefois d’avoir fn, Æ O. 
Comme la base n’a pas besoin d’être explicitement exprimée, on écrira N sous la forme : 


N= {0, Bn-2 Bma-1 . . Bm ; Mo + 1}, 


la suite ordonnée des 8m s'appelle la mantisse tandis que la puissance de la base s'appelle 
l’exposant. Il s’agit donc d’une représentation semi-logarithmique particulière dans la mesure 
où le premier chiffre significatif est différent de zéro. Sa raison d’être s’explique par la recherche 
d’une représentation optimum qui permet d'occuper la place mémoire la plus petite. Pour ce 
faire, on stocke uniquement la mantisse et l’exposant ; la base est une donnée implicite qui n’est 
pas stockée avec le nombre mais qui est évidemment indispensable pour effectuer les calculs. 


a — Une représentation des nombres flottants sur quatre octets — C’est une représentation 
qui a été fréquemment retenue par les constructeurs de grosses machines dans les années 60, 
aussi mérite-t-elle qu'on s’y attarde un peu. Le mot-machine est constitué de quatre octets 
numérotés de gauche à droite de 1 à 4, et la base implicite est 16. 

Les chiffres utilisés sont donc les symboles hexadécimaux 0, 1, 2, 8, 4, 5, 6, 7, 8, 9, A, B, C, 
D, E, F; chacun de ces symboles peut être codé en binaire sur un demi-octet, car un chiffre 
hexadécimal se code sur quatre bits. 

Par convention, la mantisse s'exprime sur les octets 2, 3 et 4, ce qui limite la représentation à 
6 chiffres hexadécimaux. Comme les nombres sont normalisés, le premier demi-octet de l’octet 
2 doit être différent de zéro. 

L’octet 1 contient le signe du nombre dans le premier bit et l’exposant dans les sept bits 
suivants. Comme précédemment le signe plus est codé par un 0 et le signe moins par un 1 
(premier bit). . 

Pour ce qui concerne l’exposant, on pourrait concevoir une représentation entière affectée 
d’un signe puisque les exposants peuvent être négatifs ou positifs. Ce n’est généralement pas la 
solution retenue. Comme on peut représenter 128 configurations possibles sur les 7 bits affectés 
à l’exposant, la convention veut que les configurations comprises entre 0 et 64 soient attribuées 
aux exposants négatifs (et exposant nul) et les configurations comprises entre 65 et 127 aux 
exposants positifs. En définitive, il suffit d'ajouter 64 à l’exposant avant de procéder au stockage. 
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b — Précision de la représentation — La troncature du nombre porte sur la mantisse seule- 
ment. Dans le cas le plus défavorable on aura négligé une suite infinie de F en notation 
hexadécimale (ce serait une suite infinie de 9 en notation décimale, ou une suite infinie de 
1 en notation binaire). Toujours est-il que cette suite infinie, quelle que soit sa base, a pour 
limite l’unité, et par conséquent, représente une erreur absolue de 1 unité sur le dernier chiffre 
significatif de la mantisse du nombre stocké: autrement dit, on aura une erreur absolue de 1 
unité sur la mantisse considérée comme un nombre entier. Cette façon de concevoir n’est pas 
toujours la mieux adaptée au calcul des erreurs, aussi préfère-t-on raisonner en terme d’erreur 
relative sur la représentation du nombre, qui se réduit à l'erreur relative sur la mantisse : 


p 1 


er noe 
mantisse 


Ici encore le cas le plus défavorable se rencontre lorsque la mantisse est la plus petite possible. 
Puisque la représentation est hexadécimale et normalisée, la plus petite mantisse vaut 165, il 
s'ensuit que l'erreur relative la plus défavorable vaut : 


er = 9,541077, 


soit environ 106. 

Compte tenu de la présence d’un digit supplémentaire utilisé en mémoire centrale lors de 
l'exécution, on ne réalise pas des troncatures mais des arrondis ce qui a pour conséquence de 
diviser les erreurs par deux, soit : 


er = 0,510 6. 


Ce type de représentation permet d'obtenir une dynamique s'étendant de 10778 à 10-75 
approximativement. 

Il existe également une double précision qui occupe huit octets. Les quatre octets supplémen- 
taires sont uniquement affectés à la mantisse. La dynamique n’est pas affectée tandis que la 
précision relative de la représentation est passée à 101$ environ. 


c — Représentation usuelle des nombres flottants dans les Basics — La plupart du temps 
la représentation s’effectue sur 5 octets et la base implicite est 2. Cette conception conduit, 
comme on va le voir, à une précision plus grande mais aussi à une dynamique plus faible que 
celle précédemment étudiée. 

L’octet 1 est utilisé pour représenter l’exposant tandis que les 4 derniers octets servent au 
stockage de la mantisse. Comme le nombre est normalisé en notation binaire, le premier bit 
de l’octet 2 est inévitablement 1. Cela constitue une information sans grand intérêt et certains 
constructeurs utilisent ce bit pour y stocker le signe du nombre, soit 0 si le nombre est positif 
et 1 si le nombre est négatif. Le premier octet permet de représenter 256 configurations qui se 
décomposent de la façon suivante : les exposants négatifs ou nuls sont représentés de 0 à 127 et 
les exposants positifs de 128 à 255. La précision relative est majorée par : 


er = 1/2 = 4,7107”. 


Le plus petit nombre représentable est de l’ordre de 107%, tandis que le plus grand est de 
l’ordre de 10%. 
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d - Représentation des entiers et des flottants dans certains langages utilisés avec les 
micro-ordinateurs — Selon les logiciels et les ordinateurs utilisés, la représentation entière 
s'effectue sur 2, 4 voire 8 octets : en binaire pur pour les entiers positifs et en complément 
à deux pour les entiers négatifs. Dans le cas de deux octets, on dispose de nombres compris dans 
l'intervalle (—32 768, +32 767). 


Remarque : En général, en arithmétique entière, au cours des calculs les dépassements de 
capacité sont automatiquement masqués et les calculs sont effectués modulo 2m, avec m = 8k-—1 
où k est le nombre d’octets retenus pour la représentation. Cette propriété sera utilisée pour 
générer des nombres pseudo-aléatoires. 


La représentation des nombres flottants s’effectue sur des doubles mots soit 4 octets. Le 
système est identique à celui utilisé pour les Basics à la différence près toutefois qu’on ne 
dispose plus que de 3 octets au lieu de 4 pour écrire la mantisse. En conséquence de quoi la 
dynamique est évidemment la même, tandis que la précision se trouve un peu réduite, elle se 
situe au voisinage de : 


en = 1/2” = 1,210 *. 


e — La double précision — Par exemple, en C, dans les micro-ordinateurs usuels, la repré- 
sentation des nombres en double précision s'effectue sur 8 octets, soit 16 demi-octets. Les trois 
premiers demi-octets contiennent le bit de signe du nombre suivi de l’exposant, ce qui permet une 
dynamique de l’ordre de 107808 à 10308, La mantisse est représentée sur les treize demi-octets 
restants. La plus petite mantisse est donc 8 x 16!? sur laquelle l'erreur d’arrondi est 0,5. La 
précision relative la plus défavorable est donc de l'ordre de 0,210716. 
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Quelques algorithmes 
accélérateurs 
de la convergence des suites 


Au cours de ce chapitre, nous allons présenter quelques algorithmes très puissants qui ont pour 
but d’accélérer la vitesse de convergence des suites. Il s’agit de l'algorithme d’Aitken, du procédé 
d’extrapolation de Richardson et de Pepsilon-algorithme, ce dernier ayant vu le jour en 1956 à 
la suite des travaux de P. Wynn. Nous nous attacherons essentiellement à leur présentation et 
à leur mise en œuvre dans la mesure où nous ferons souvent appel à eux au cours des différents 
chapitres. 

Sans entrer dans des considérations théoriques de haut niveau, il est possible de dire que 
d’une part l’epsilon-algorithme est une généralisation du procédé d’Aïtken, et que d’autre 
part il est relié aux approximants de Padé et aux fractions continues (cf. annexes C et D). 
Il n’est pas question d'effectuer ici les justifications théoriques relatives à ces algorithmes et 
nous limiterons nos ambitions à en apprendre le maniement. Cependant, le lecteur intéressé par 
les fondements des techniques d’accélération de convergence pourra avoir recours à l’excellent 
ouvrage de C. Brézinski : Algorithmes d’Accélération de la Convergence. Étude Numérique, aux 
Éditions Technip, Paris (1978). Dans cet ouvrage figurent d'autres procédures d'accélération de 
la convergence, de nombreux exemples d'applications et des programmes rédigés en Fortran. Pour 
tout ce qui a trait aux procédures d’accélération de la convergence, il est nécessaire d'insister 
sur le fait que les résultats proposés ne concernent que les nombres susceptibles de pouvoir être 
effectivement calculés avec une précision suffisante. 


1. L'algorithme A? d’Aitken (1895-1967) 


Supposons que nous connaissions une suite numérique convergente So, S1,...,#9n. Par exemple 
les Sk peuvent être constitués par les sommes partielles d’une série, ou encore par la suite des 
approximations successives de la racine d’une équation f(x) = 0 obtenues par une méthode 
itérative. À partir de cette suite de (n + 1) termes, nous allons construire une autre suite de 
n termes et ainsi de suite. Nous définissons une procédure récurrente, et pour les besoins de 
la cause, nous allons numéroter des suites ainsi formées au moyen d’un exposant placé entre 
parenthèses. Ainsi, la suite initiale s'écrit : 


so, s®,..., 50). 
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1.1. Présentation de la méthode 


Considérons une suite numérique so, so, s® J s% dont la convergence est lente. À partir 


de la suite des S (o) on forme une nouvelle suite 50) obtenue de la manière suivante : 


| ©) o0) 
k+2 k+1 


S = A 0 g 
) 0 0 
a t 


À partir de la dernière suite formée, celle des s®, on obtient une autre suite au moyen du 
même procédé. On note qu’à chaque construction d’une nouvelle suite, le nombre d’éléments 
de la suite diminue de deux unités. L'application successive de ce processus nous conduit à 
l'obtention de la suite qui n’est plus constituée que d’un seul terme à condition toutefois que le 
nombre de termes de la suite initiale soit impair. Le terme général s'écrit alors : 


lsi a sl ; 


+ 200 


su) = S9) (2.1) 


T ~H k42 


1.2. Un exemple numérique 


On se propose d'appliquer cet algorithme à la suite des sommes partielles obtenue par la 
sommation de la série : 


1 1 1 1 T 
Ses E E ue 
A A 4 
qui est bien connue pour sa convergence lente. En retenant les cinq premiers termes de la suite 
on trouve § = 0,834920. L'usage de l’algorithme d’Aitken, avec les mêmes nombres, permet de 
trouver $ = 0,785 526. Autrement dit, l'erreur relative sur m passe de 6,3 102 à 5,1 1074. 
On trouvera sur le Web *) un programme aitken0.c mettant en œuvre cet algorithme. 


2. Le procédé d’extrapolation de Richardson (1881-1953) 


ui ; 0 A PURE a ; 
On désigne toujours par S{ ), avec j = 0,1,2...n, la suite initiale que l’on désire voir converger 
g jours par S} j q g 
plus rapidement, et par £p une suite auxiliaire « choisie convenablement ». Nous aborderons un 
peu plus loin le problème du choix de la suite auxiliaire. La méthode de Richardson consiste à 
former une suite de « vecteurs » au moyen de la relation suivante : 


(k) (k) 
SH) — LmSm+1 7 Em+k+19m (2.2) 
; : 
j Em — Tm+k+1 
avec m,k = 0,1,2,...n. La succession des opérations est symbolisée par le tableau 2.1, page 
ci-contre. 


Dans la mesure où les £m sont indépendants des SE ), il est aisé de > PRO qu'il s’agit 
d’un algorithme en triangle et que SX est une combinaison linéaire de s®, et SẸ? il s'ensuit, 


alors, que le procédé de Richardson est une transformation linéaire de suites. 


Remarque : Dans le cas particulier où l’on choisit comme suite auxiliaire la suite : 
0 0 0 
Em = S, - 80 = ASD), 


* http://www .edpsciences .com/guilpin/ 
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Tableau 2.1. 
so 
Sa 
5° s® 
s® s® 
s® s® 5) 
s®) s®) 
s® s® 
0 
a 


on obtient alors un algorithme qui n’est plus en triangle et qui n’est plus linéaire. La relation 
générale est donnée par l'expression : 


0 k 0 k 
gun ASM Sm — ASS | (2.3) 
A (0) 0 ' 
ASm — PES 


2.1. Quelques éléments de théorie 


Revenons à la suite initiale se qui converge vers S ainsi qu’à la suite auxiliaire z indépendante 
des S . que l’on suppose d’une part strictement décroissante et d’autre part tendre vers zéro 
lorsque n tend vers l'infini. Le procédé d’extrapolation de Richardson est fondé sur la formule de 
Neville-Aitken qui donne une façon de construire les polynômes d’interpolation pour une valeur 
particulière de la variable (cf. chapitre 6 sur l’interpolation). En effet, se est la valeur en zéro 
du polynôme d’interpolation de degré k, lequel, aux abscisses xp, prend les valeurs so pour 
pP=j, j +1,...,j +k. 

À présent nous allons énoncer quelques théorèmes importants, mais dont nous ne donnons 
pas la démonstration. 


a — Théorème | — Pour que s tende vers § quel que soit j > N, il faut et il suffit que 
s =s+ RE ax?, quel que soit m > N. 

Autrement dit, les S de peuvent s'exprimer sous la forme d’un rapport de deux déterminants, 
ce qui constitue une autre expression de ce théorème : 


(0) (0) 
S5 Shax 
Tj Tj+k 
k k 
COR: Tj+k 
7 1 1 
Tj Tj+k 
k k 
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b — Théorème Il — Si la suite xx (formée de nombres réels positifs, décroissante et tendant 
vers zéro lorsque n tend vers linfini) vérifie la relation : 


Tn 


>a>1 

Ln+1 
pour tout n, alors la limite de la suite so tend vers S quand k tend vers l'infini. La condition 
énoncée est nécessaire et suffisante. Ce théorème nous donne des indications sur les choix 
possibles de la suite des xj. Par exemple, il est raisonnable de retenir la suite x, = a” et 
de l’assortir de la condition 0 < a < 1. 


c — Théorème III — Dans le cas où so = (zj) et que P(x) est suffisamment dérivable, et 
que le module de la dérivée (k+1)° demeure borné sur l'intervalle T (I est le plus petit intervalle 
contenant le point zéro et toute la suite zn) par un nombre M indépendant de x, alors st”) 


tend vers S quand l tend vers linfini. Si de plus M est indépendant de k, alors st) tend vers 
S lorsque k tend vers linfini. 


d — Théorème IV — (Ce théorème concerne l’accélération de la convergence.) Dans le cas où 
les conditions du théorème II sont satisfaites, pour que la suite S se converge plus vite que la 
suite Ce , il faut et il suffit que : 


Tm+k+1 


= quand m tend vers l'infini. 
w-sS Tm 


Cependant, force nous est de reconnaître que cette condition n’est pas aisément vérifiable 
dans les cas pratiques. 
2.2. Généralisation du procédé de Richardson 


On considère une fonction Y(x) définie, continue et strictement croissante sur l'intervalle (0, 8) 
avec 8 > 0. Alors, dans la relation (2.2), on peut remplacer x, par [Y (z4) — Y(0)] sans que rien 
de ce qui vient d'être établi ne soit modifié. On obtient alors la relation : 


gian L PU) PONS — ein) = WOS 
j Y(x;) =t U(Tjtk+1) 


Le théorème I s’énonce alors de la façon suivante : 


(2.4) 


Théorème V - Pour que S a tende vers § quel que soit j > N, il faut et il suffit que : 


SO = s+ Du (W(x:) - v(0)). 


Voici quelques choix possibles pour les fonctions Y{x) : 


Y(x) = x1 avecq > 1 
Y(x) = a” avec a > 1 
(z) = log,(1 + x). 
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Remarque : Si V(x) et Va(x) vérifient les conditions de la généralisation, alors les fonctions : 


g(r) = a Vi(x) + a2Ÿo(x) 
g(x) = Yi(x) - Yo(x) 
g(x) = Yı [Yo(x)], 


vérifient aussi les conditions de la généralisation. 


2.3. Relation entre le procédé A? d’Aitken et celui de Richardson 


Revenons à l’expression (2.3) obtenue en remplaçant x, par AS®). Elle vérifie les conditions 
des théorèmes précédents, et si l’on fait k = 0, nous obtenons : 
(0) «(0) (0) (0) 
SG) — Sj Sja = Sin 


i T cO (0) (0) 
Sj42 7 29i +5; 


On reconnaît le procédé d’Aitken en réduisant au même dénominateur l’expression (2.3), et du 
reste on verra un peu plus loin que ce vecteur de composantes Date est également la deuxième 
colonne du tableau de l’epsilon-algorithme. 


Un exemple numérique — Nous allons appliquer l'algorithme de Richardson à la suite des 
sommes partielles de la série : 


l1 1 1 1 n? 
S=1+5 +5 +5 H+ +... = — [= l,6449340668... 
22 3 4 5 6 
Ici il nous faut en plus choisir une suite auxiliaire, et nous avons retenu arbitrairement la 
suite classique £m = 4 convergente et qu’il ne faut pas confondre avec la série harmonique qui 


diverge. 
Nous avons effectué les calculs avec les 25 premières sommes, et voici les résultats trouvés : 


S(25) = 1,605 723 403 
S(Richardson) = 1,644 941. 


En comparant avec le résultat connu on voit que l’erreur relative sur la somme est de 5,0 1076. 
On trouvera sur le Web (*) un sous-programme richarO.c qui réalise cet algorithme. 


3. Présentation de l’epsilon-algorithme scalaire 


Il s’agit sans doute, dans l’état actuel des connaissances, du plus puissant algorithme permettant 
d'accélérer la convergence des suites. Comme précédemment on conserve les notations introduites 
au cours de ce chapitre, à l'exception toutefois de la suite initiale qui prend le rang 1 au lieu du 
rang zéro. Autrement dit, la suite initiale s'écrit : s®, 

Les termes de la deuxième suite s’expriment au moyen des relations suivantes : 


1 


1 1 
a, 


2 0 
S T Sii + 


*http://www.edpsciences.com/guilpin/ 
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À p 0 ; nE 
où k —0,1,...,(n—1), et avec comme convention s 20 quel que soit k. On forme la troisième 
suite au moyen de la relation : 


1 

s9 = 50) 4 

2 2) ? 
CRT 


et d’une manière tout à fait générale, la p° suite sera donnée par : 


1 


Sa 


2) 
IA = va ' 


où k = 0,1,...(n — p + 1). On poursuit les calculs jusqu’à ce que Pon n’obtienne plus qu’un 
seul terme qui est se). Il s’agit maintenant non plus d'un algorithme en triangle mais d’un 
algorithme en losange. On se persuade facilement que les résultats intéressants figurent dans les 
suites de rang impair, il faut donc choisir un nombre impair de données au départ, soit (n +1) 
impair, pour que le terme si) soit une approximation de la limite de la suite sa. Les suites 
de rang pair ne constituent que des intermédiaires de calcul. 


3.1. Exemples numériques 
On désire calculer la somme de la série alternée déjà évoquée au cours du premier paragraphe : 
1 1 1 1 


DNS 2. 
S=1 3 + 57 + g 0,785 398 


Sur le tableau 2.2, nous avons donné les suites successives S (a) en limitant la suite initiale à 
5 termes : 


Tableau 2.2. 
st S@) s68) S9) s65) 
1 
—3 
0,666 666 6 0,791 666 6 
+5 —115 
0,866 666 6 0,783 3333 0,785 585 
—7 +329 
0,723 8095 0,786 309 5 
+9 
0,834 920 6 


L'erreur relative sur la valeur donnée par 5) est 2,41074. 


3.2. Calcul de la somme d’une série de Fourier 


La fonction qui vaut —1 entre —x et 0 et +1 entre 0 et m admet le développement en série de 
Fourier : 


f(z) = 


4 (=e _sin(3z) sin [(2p + Dz] +). 


rm 1 3 2p+1 


36 


2. QUELQUES ALGORITHMES ACCÉLÉRATEURS DE LA CONVERGENCE DES SUITES 


Cette série sera étudiée chapitre 16 et elle servira d'introduction à l’étude du phénomène de 
Gibbs. Du fait de la discontinuité de première espèce de la fonction, la série converge lentement 
et, qui plus est, nous sommes en présence du phénomène de Gibbs. En appliquant l’epsilon- 
algorithme à la suite des onze sommes partielles formées entre le terme d’ordre 40 et le terme 
d'ordre 50 dont voici les valeurs : 


5%) = 1,002 194 232 20 S{P = 1,017 439 936 43 S$} = 1,031 279 46480 
S£? = 1,043 240 233 83 51) = 1,052 942 746 94 S£? = 1,060 110 38253 
S£? = 1,064 575 093 01 S£? = 1,066 278 967 14 5% = 1,065 271 752 62 
SË = 1,061 70457349 SQ) = 1,055 820 201 84. 


on obtient la valeur : S = 1,000 689 pour la valeur x = 0, 1. 
Conclusion : l’epsilon-algorithme fait disparaître le phénomène de Gibbs, c’est-à-dire les lentes 
oscillations au voisinage de la discontinuité. 


4. L'epsilon-algorithme vectoriel 


Les suites S() ne sont plus des grandeurs scalaires mais des grandeurs vectorielles. Il est donc 
nécessaire de préciser la technique de calcul des opérations proposées notamment en ce qui 
concerne la grandeur : 


1 (88, - s9). 


La différence de deux vecteurs ne pose pas de problème, et il nous reste à définir l'inverse V~! 
(= 1/V) d’un vecteur V. Cette opération n’est pas définie habituellement, mais pour le cas qui 
nous préoccupe, on admettra qu'elle est réalisée en multipliant numérateur et dénominateur par 
le vecteur V* dont les composantes sont les composantes complexes conjuguées du vecteur V. 
Ainsi nous avons : 

vas NT SN”, 
V.V* Vy? 

Cette précision apportée, rien n’est modifié dans la conduite du calcul. 

Si la suite à traiter est formée de nombres complexes, rien ne nous empêche de considérer 
un nombre complexe comme un vecteur à deux dimensions et d'appliquer l’epsilon-algorithme 
vectoriel. 

Cet algorithme vectoriel trouvera son emploi chaque fois que le résultat d’un calcul itératif est 
donné par un ensemble de valeurs (U;) que l’on peut alors considérer comme les composantes 
d’un vecteur. Par exemple, nous étudierons la méthode de Picard qui permet d’obtenir par 
itérations un échantillon d’une certaine fonction solution d'une équation différentielle. Cette 
méthode converge très lentement et il va de soi que nous pourrons l’accélérer au moyen de 
l’epsilon-algorithme vectoriel. 


5. L'epsilon-algorithme matriciel 


Ici, il n’y a aucune difficulté à définir la différence de deux matrices carrées de même ordre et 
l'inverse d’une matrice, pourvu que cette dernière soit régulière. La technique de calcul se trouve 
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inchangée. Il est bon de remarquer que l’epsilon-algorithme ne s’applique qu’à des matrices 
carrées ; il s'ensuit qu'une suite convergente de matrices rectangulaires ne peut pas être accélérée 
par ce procédé puisque ces matrices ne possèdent pas d’inverse mais seulement deux pseudo- 
inverses qui ne peuvent pas faire l’affaire. 

En revanche, sur le plan pratique, il est tout à fait possible d’appliquer l’epsilon-algorithme à 
une suite de matrices rectangulaires ou carrées pour en accélérer la convergence et cela en faisant 
usage de l’epsilon-algorithme vectoriel appliqué à chacun des vecteurs-lignes ou chacun des 
vecteurs-colonnes. Cette remarque prend toute sa signification lorsque la suite des matrices est 
constituée de ce que l’on appelle des matrices mal conditionnées. Dans ce cas, il est extrêmement 
fréquent d’obtenir des erreurs de calcul très importantes qui se répercutent sur l’ensemble des 
éléments de la matrice notamment lors de l’opération d’inversion. Cet aspect négatif des choses 
se trouve alors réduit par l’usage de l’epsilon-algorithme vectoriel. 

L’epsilon-algorithme matriciel peut trouver une application lors des problèmes de résolution de 
l'équation de Laplace (1749-1827) (ou de Poisson) par la méthode itérative de Gauss-Seidel dans 
le cas particulier où la représentation du maillage conduit à une matrice carrée. Toutefois, quels 
que soient la géométrie et le maillage retenu pour intégrer l'équation de Laplace, dès lors que 
l’on utilise une méthode itérative, il est toujours possible d’utiliser ou bien l’epsilon-algorithme 
scalaire ou bien l’epsilon-algorithme vectoriel. 


6. Remarques et propriétés de l'epsilon-algorithme 


1. Nous venons de voir la forme scalaire de l’epsilon-algorithme, la forme vectorielle et la 
forme matricielle. Pour information, il existe aussi deux formes topologiques que nous nous 
contentons de mentionner. 


2. Lorsqu'on applique l’epsilon-algorithme à une suite, il n’est pas nécessaire de débuter les 
calculs à partir du premier terme de la suite et l’on peut très bien prendre les termes de q en 
q à partir du rang k pour former la suite initiale (cf. l'exemple concernant le phénomène de 
Gibbs). 


3. L’epsilon-algorithme ne peut donner que ce qu’il a, c’est-à-dire qu’il peut accélérer la 
convergence à condition toutefois que la précision des termes retenus soit suffisante. En 
aucun cas il ne peut fournir une précision supérieure à celle qui a servi à faire les calculs 
des termes initiaux. Autrement dit, si le dernier élément sw de la suite initiale a été 
obtenu à la « précision de la machine », c’est-à-dire que l'addition du terme suivant de la 
série laisse inchangée la valeur de s® , il est inutile de vouloir appliquer l’epsilon-algorithme 
quand bien même bénéficierait-on d’un accroissement de précision pour réaliser cette dernière 
opération. Par exemple, si nous avons obtenu sP en simple précision, lapplication de 
l’epsilon-algorithme en double précision n’apportera strictement rien. Il n’est pas possible 
d'extraire une information qui n’est pas contenue dans les données. 


4. À loccasion de l'étude des séries de Fourier, on rencontre un phénomène gênant qui se 
manifeste au voisinage des points de discontinuité de première espèce (lorsque la fonction 
développée présente ces discontinuités) : c’est le phénomène de Gibbs (1839-1903). L’epsilon- 
algorithme supprime le phénomène de Gibbs qui se traduit normalement par des oscillations 
de grande amplitude lesquelles s’amortissent très lentement avec le nombre de termes de la 
série de Fourier. 


38 


2. QUELQUES ALGORITHMES ACCÉLÉRATEURS DE LA CONVERGENCE DES SUITES 


5. Il est possible qu’à un moment donné la quantité (s®, — se à) soit nulle ce qui fait tomber 


en défaut le mécanisme d’accélération de la convergence puisque l’inverse de cette grandeur 
produit un dépassement de capacité en machine. Dans la plupart des cas cette difficulté se 
rencontre lorsque les S' (p ) ont été calculés à un moment donné « à la précision de la machine » 
et il s'ensuit que l’on retiendra ce résultat. S’il n’en est pas ainsi, bien qu’il existe des règles 
particulières qui peuvent être utilisées, il est souvent préférable d'abandonner la procédure. 
En conséquence de quoi, il est recommandé d’effectuer un test sur les différences (S si — sP » 
dans le programme et de procéder à l’arrêt des calculs lorsque l’une de ces différences est nulle. 
Au préalable, on aura pris soin d’enregistrer ou de faire imprimer les résultats partiels qui 
demeurent susceptibles d’être exploités. 


Réalisations pratiques — Sur le Web (*), on trouvera deux programmes réalisant lun l’epsilon- 
algorithme scalaire epsilon.h et l’autre l’epsilon-algorithme vectoriel evectrO.h. 


L'epsilon-algorithme dans les autres chapitres 


1. Calcul des limites de suites, application au calcul numérique des intégrales. 


2. Calcul des séries de Fourier, suppression du phénomène de Gibbs, calcul des dérivées ayant 
un développement divergent. 


3. Résolution des équations f(x) = 0. 


4. Accélération de la convergence des méthodes itératives utilisées lors de l'intégration des 
équations différentielles. 


5. Accélération de la convergence lors de la recherche des valeurs propres des matrices. 

6. Accélération de la convergence lors de la résolution des systèmes linéaires et non linéaires. 
7. Intégration des équations aux dérivées partielles de type elliptique. 
8 


. Résolution des équations intégrales de Fredholm de deuxième espèce (série de Liouville- 
Neumann). 


On trouvera sur le Web (*) des illustrations de ces différents problèmes : aitken2.c,epsil0.c, 
epsili.c, epsil2.c, epsil4.c, kacmarzi.c et newtonO.c. 


7. Propriétés remarquables du procédé A? d'Aitken 
et de l’epsilon-algorithme 


7.1. Le prolongement analytique 


Si une fonction admet un développement en série de puissances convergent dans le disque D, 
on peut en général effectuer le prolongement analytique de cette série en dehors du disque de 
convergence. Alors il est possible d’appliquer l’un des algorithmes à la suite des sommes partielles 


*http://www.edpsciences.com/guilpin/ 
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même si celle-ci est divergente, c’est-à-dire hors du cercle de convergence. Considérons par 
exemple la série : 


1 
— =1-v+a -rtrt +... 
Ttg 


Cette série a un rayon de convergence strictement plus petit que 1. Appliquons les algorithmes 
à la valeur x = 99. En limitant le nombre de termes à 5, on obtient les résultats suivants 


St = 1,000 000 000 0 Æ + 00 
Sł = —9,800 000 0000 E + 01 
SŁ = 9,703 000 0000 E + 03 
S} = —9,605 960 0000 E + 05 
S} = 9,509 900 5000 E + 07. 


Il est évident que cette suite diverge ; cependant l'application des algorithmes donne comme 
limites : 


Aitken S = 1,000 000 536 4 E — 02 
Epsilon-algorithme S = 1,000 000 0000 E — 02 


alors que le calcul direct de la fraction donne § = 1072. 
Sur le Web +). on donne les programmes aitkeni.c et epsil13.c qui réalisent ces opérations. 


7.2. Les développements asymptotiques 


Il est une autre série divergente extrêmement intéressante qui concerne les développements 
asymptotiques sur lesquels les algorithmes d'accélération de la convergence donnent de remar- 
quables résultats. Sur le plan théorique, il est aisé de rattacher ces développements aux 
prolongements analytiques, car on passe de l’un à l’autre par une inversion, c’est-à-dire en 
posant x = 1/x. Il n’est plus nécessaire de choisir x « grand » ni de limiter strictement la somme 
partielle à calculer à un ordre bien précis N donné par le calcul des erreurs. 

Voici quelques exemples de développements asymptotiques et les différents résultats obtenus 
au moyen des procédés d'accélération de la convergence. 


OO 
f(x) = fe exp(x — t) dt avec z > 0. 


T 
admet comme développement asymptotique l'expression (cf. chapitre 3) : 


1 1 2 3! non! 
f(x) = aa Hee (1) Per NOM 


* http://wwuw.edpsciences.com/guilpin/ 
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Pour x = 1, f(1) = 0,596 336, tandis que les quinze premières sommes partielles sont : 


Si = 1,0 

S} = 0,0 

S} = 0 

S3 = —4,0 
S} = 20,0 
S = —100,0 
SŁ = 62,0 
S} = —442,0 
Sł = 3 590,0 


Sł = —3,26980 E + 05 
Si, = 3,301 820 E + 06 
Si, = —3,661 498 E + 07 
S1, = 4,423 866 20 E + 08 
S1, = —5,784 63418 E + 09 
S1, = 8,139 365 702 E + 10. 
Voici les résultats obtenus : 
A?d’Aitken Epsilon-algorithme 
0,596 347 0,596 572 


7.3. La série de Liouville (1809-1882) - Neumann (1832-1925) 


Considérons une équation intégrale de Fredholm (1866-1927) de deuxième espèce : 


1 
a(t) -p | KM, sels) de = yti), 


que lon écrira de façon plus concise : 
z— pÅz =y 


où À est l'opérateur « intégrale » qui est évidemment linéaire. 
Sous réserve de convergence, la série de Liouville-Neumann donne la solution du problème : 


z = y+ pAy + pAy + PA y+ Ay 


On reconnaît la série géométrique dont la convergence sera assurée si 


1 
m lAx|, 
ipl 
où |A;| est la plus grande valeur propre de À en module (cf. Jean Bass, Cours de mathématiques, 
Masson, 1968 et Lichnerowicz, Algèbre et Analyse linéaires, Masson, 1955). 

Ici encore, l'application de l’epsilon-algorithme vectoriel à une suite divergente conduit au 
bon résultat. 
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Exemple 
1 
U(x) = exp x? + sf (cos(r) +2V3sin(rx)(y — 0,5)) U(y) dy. 
0 


On a retenu neuf vecteurs, c'est-à-dire les sommes partielles jusqu’à p$ Aŝy. Chacune des ces 
fonctions a été échantillonnée sur vingt et un points. Nous avons obtenu pour les éléments du 
dernier vecteur l’ordre de grandeur de 10“ car la série de Liouville-Neumann est divergente. 

La technique de résolution de l’équation de Fredholm est une méthode self-consistante qui 
permet d’obtenir aisément l'erreur. L’epsilon-algorithme donne une erreur inférieure à 10-12 au 
sens du sup. 

On trouvera sur le Web (*) le programme fredholm.c qui réalise ce calcul. 


8. Éléments de bibliographie 
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asymptotiques 


Les développements asymptotiques, encore appelés séries semi-convergentes, constituent une fort 
belle application numérique des séries divergentes. Le but est d’associer à une certaine fonction 
f(z) un développement du type : 


Sous certaines conditions que nous allons évoquer, le développement divergent, tronqué à 
un ordre convenable, permet de calculer numériquement la fonction f(x) avec une précision 
d'autant plus grande que le module de l'argument est plus élevé. Par exemple, on rencontre en 
analyse classique un tel développement quand on veut calculer la constante d’Euler (1707-1783) 
avec une grande économie de moyen (cf. annexe H, exercice 1-4). 


1. Un exemple de développement asymptotique 


Considérons la fonction cosinus intégral : 


Cia) = - [SË a avec x > 0. 


T 


Intégrons successivement par parties, nous obtenons : 


sin(x) cos(x)  2sin(r) R 6 cos(x) Fe 


EC z x? z3 rt 
„ (2n)!sin(z) „(2n + 1)!cos(z) T cos(t) 
+ ER à (26 +! f SES at. 


Soit encore : 


Cila) = F 3 p cos) D pe e 
n=0 n=0 
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Ce développement est divergent comme le montre le critère de d’Alembert. Pour la série ayant 
sin(æ)/x en facteur, on obtient : 
(2n+2)!x? 4n? 
(2n)!r2r+2 ~ g? 


quel que soit x. On peut trouver n suffisamment grand pour que An? > z? ce qui montre le 
caractère divergent de la série. On a le même résultat avec la seconde série ayant cos(x)/x 
comme coefficient, mais une seule série suffit... pour montrer la divergence. On aurait pu dire 
aussi que le terme général de chacune des séries ne tend pas vers zéro quand n tend vers l'infini, 
ce qui suffit à assurer la divergence. 


Désignons par S(x) la somme constituée des deux séries qui sont tronquées chacune à 
l’ordre k : 


. k : 
ue ce S\ 1)" re cos(e) S\ 1) (2n +1)! 
es n=0 


x2n+1 , 
il est alors facile de calculer l'erreur liée à l'approximation : 


Exx(x) = |Ci(x) — Sax(x)| 


que l’on peut écrire encore : 


oo o0 
cos(t dt 
Ent) = (2+ D!| S SD at < (2k +1) ama 


On s'aperçoit que E24(x) est une fonction croissante en k et décroissante en x. Pour connaître 
l’ordre k du développement pour lequel l'erreur est minimum, il suffit d’écrire que : 


E(x) & Exçp+n(x) (ou encore ~ E(x_1)(x)). 


On en déduit immédiatement, dans le cadre de notre exemple particulier, que : 


(2k)! (2k +2)! 
ai —  g2kt3 


d’où l’on tire : x ~ 2k +1. 
Donc, pour x fixé, il suffit de calculer 2k termes de la série asymptotique en choisissant k 
donné par l'expression : 


he 


, soit k% 


NIS 


Considérons un exemple numérique en supposant que x = 10, on en déduit immédiatement 
que k = 5. On peut alors évaluer : 


10! : 
Ero(x) = Ts 0,36 1074. 
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Rappelons que cette erreur est liée strictement à la troncature des deux séries; lors de 
l'exécution des calculs, il faudra ajouter les erreurs effectuées sur chacun des termes constituant 
les sommes. 

Il suffit donc de calculer la somme des cinq premiers termes des deux séries pour connaître 
Ci(10) avec une précision supérieure à 0,361074. La somme S4(10) donne : S2x(10) = 
0,454 81 107? et l’on peut donc voir que l'algorithme proposé permet d’obtenir les trois premiers 
chiffres significatifs exacts. En définitive : 


Ci(10) = 4,548 107? 0,003 6 10 ?. 


Pour la petite histoire, il semble que ce soit Stokes G.G. (1819-1903) qui ait pressenti le 
premier l'intérêt d’une telle procédure, et c’est à Poincaré H. (1854-1912) que revient le mérite 
d’avoir développé la théorie (1886), essentiellement dans le but de résoudre quelques équations 
différentielles apparaissant en mécanique céleste et en mécanique analytique. 

Ajoutons que ces développements servent principalement à approcher les fonctions dites 
« spéciales » pour des arguments dont le module est élevé — disons de plusieurs unités ou 
dizaines d’unités. 

Les travaux de Poincaré permettent d'apporter quelques précisions sur la notion de dévelop- 
pement asymptotique et ce sont ses propres idées que nous allons rappeler succinctement. 


Définition 
On dira que la série S,(x) représente un développement asymptotique de la fonction f(x) 
au voisinage de l'infini si, sur un certain intervalle JJa, | auquel appartient x, les conditions 


suivantes sont remplies : 
En posant R,(x) = x" (f(x) — S,(x)), on doit avoir : 


lim R,(x) = 0 quel que soit n même lorsque 
T—00 


lim R,(x) > oo quel que soit x fixé. 


nn O0 


Il en résulte que l’on pourra toujours prendre x suffisamment grand de telle sorte que l'inégalité 
suivante soit vérifiée : 


z” [f(2) — Sh(z)]l < £, 


où € est un infiniment petit positif fixé à l'avance. 
Pour utiliser au mieux le développement asymptotique, on choisit n de telle façon que l'erreur 
commise sur l'approximation soit la plus petite possible. 


2. Quelques propriétés utiles des développements asymptotiques 


Unicité du développement asymptotique — Quand une fonction f(x) admet un développe- 
ment asymptotique, alors ce développement est unique. 

L’affirmation inverse est fausse car deux fonctions différentes peuvent avoir le même dévelop- 
pement asymptotique. En effet, supposons que les deux fonctions diffèrent de exp(—ax) avec 
la partie réelle de œ positive, alors, les coefficients du développement asymptotique de cette 
quantité sont identiquement nuls. 
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Toutes les fonctions f(x) n’admettent pas nécessairement un développement asymptotique, 
cependant, il se peut qw’il existe une fonction (x) telle que la fonction : 


Y(x) = f@) 
(x) 
admette un développement asymptotique >> . Alors on peut écrire : 
j=0 


(se) 


fe) =a) À 


j=0 


Intégration d'un développement asymptotique — Supposons que la fonction f(x) admette un 
développement asymptotique que nous écrirons : 


avec ao Æ 0; alors on peut intégrer le développement sur l'intervalle x < t < œ pour les grandes 
valeurs de x. Nous obtenons donc : 


OO 


Jl D-a- 7] tD pim Da | 


T 


On comprendra immédiatement la nécessité de retrancher les deux premiers termes qui 
conduiraient inévitablement à des divergences. 


Différentiation d'un développement asymptotique — La différentiation des séries en général 
est une opération délicate et il faut des conditions assez fortes sur les fonctions développées pour 
qu’il y ait égalité entre la dérivée de f(x) et la dérivée du développement asymptotique. Pour 
commencer, il faut que f(x) admette une dérivée f'(x), de plus, il faut que f'(x) soit continue 
et admette un développement asymptotique ; alors l'opération de dérivation devient légitime. 


Combinaison linéaire de développements asymptotiques — Si deux fonctions f(x) et g(x) 
admettent chacune un développement asymptotique que nous écrirons sous la forme : 


=D a ES, 
n=0 N 


alors la fonction (x) = ÀAf(x)+ug(x), où À et u sont deux nombres, admet pour développement 
asymptotique : 


(a) = y Aap + pbk 


k 
£ 
k=0 


Produit de deux développements asymptotiques — Si deux fonctions f(x) et g(x) admettent 
chacune un développement asymptotique alors la fonction Y{x) = f(x) -g(x) a pour développe- 
ment asymptotique : 


3. LES DÉVELOPPEMENTS ASYMPTOTIQUES 


Rapport de deux développements asymptotiques — Si deux fonctions f(x) et g(x) admettent 
chacune un développement asymptotique alors la fonction Q(x) = f(x)/g(x) a pour développe- 
ment asymptotique : 


à condition toutefois que bọ soit différent de zéro. 


— Si une fonction f(x) admet un développement asymptotique et si une fonction O[f(x)] 
possède un développement en série entière convergent dans le cercle de rayon |f| < p, alors le 
développement asymptotique de © s’obtient en portant le développement asymptotique de f 
dans le développement en série entière de © . 


3. Développement asymptotique de quelques fonctions spéciales 


3.1. Sinus intégral 


Si(z) = 7 _ cos(z) DO ! sin(x D peni | 


t 
3 sin(x) < n(n)! cos(x) © n(2n +1)! 
D a D 
3.3. Exponentielle intégrale 
to) = [2E a pour x> 0 
I + pr n! pr+i ME dt 
=D ten EE a 
3.4. Les fonctions erf(x) et cerf(x) 
erf(x z je t?) d 
a (= 
cerf(x) = 1 — and 
ep) f AS 135., í pel 3 5n), 
ii E/T 2 2274 9376 on—1y2n—2 
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3.5. Les intégrales de Fresnel (1788-1827) 


C(x) = | cos(nt?/2) dt et S(x) — | sin(nt?/2) dt 
J ; 
COS N. 2 ee . . .. n 
C(x) = ; + me /2) D (071 = Te D 
n=0 
sin(rxr?/2) < ny1 3:7-11- (4n -1 
= /2) > e ER . 
sin(rx?/2) © Had iie te 
sle) = 5 + PETA) Do m 
cos(rx?/2) © n13°7-1l1-..(4n —1) 
Pr DO Gr 


3.6. Les fonctions de Bessel (1784-1846) 


Le calcul numérique des fonctions de Bessel fait l’objet d’un chapitre à part (annexe F), 
cependant le calcul de ces fonctions pour les grandes valeurs de l'argument trouve sa place 


dans ce chapitre. 
Les fonctions de Bessel de première et de seconde espèces notées respectivement J,(x) et 


N,(x) sont solutions de l’équation différentielle : 


dy lidy n? 


dx? RP et ni 


Les développements asymptotiques sont donnés par les expressions : 
h(t) = 1 2 (An (x) cos(U) — B,(x) sin(U)) 

TT 
Nés (AG) sin(U) — B, (x) cos(U)) 

TT 


dans lesquelles on a noté : 


17 
U = x — —)— 
z- (n+ 5) 


(4n? —1?)(4n? — 32) (4n? — 12)(4n? — 32)(4n? — 52)(4n? — 72) 
2!(8x)? $ A(8x)* 

o (4n?—1?) (An? — 12)(4n2 — 32)(4n? — 5?) 

ES 318) 
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4 | Résolution des équations 
numériques 


Dans ce chapitre, nous étudions quelques méthodes de résolution des équations du type f(x) = 0 
suivi de quelques méthodes de résolution de systèmes non linéaires d'équations, puis nous 
terminons par l'étude d'une méthode spécifique concernant les équations algébriques. Nous 
limitons notre étude aux fonctions réelles, mais, comme nous le verrons, bien des méthodes 
pourront être étendues sans grande difficulté au cas de la variable complexe ; et dans la mesure 
où les calculateurs utilisés permettent d’effectuer les calculs en complexes, il n’y aura que peu 
de changements à apporter aux algorithmes et programmes proposés. 

On a l’habitude de classer les équations f(x) = 0 en deux types qui sont les équations 
algébriques (polynômes) et les équations transcendantes c’est-à-dire celles qui ne sont pas 
réductibles à un polynôme. Toutes les méthodes qui s'appliquent à la résolution d’équations 
transcendantes s'appliquent également aux équations algébriques et cela sans préjuger des ennuis 
possibles de calcul numérique. En revanche, pour ce qui concerne les polynômes, il existe quelques 
méthodes spécifiques dont certaines sont très utiles à connaître, c’est la raison pour laquelle nous 
étudions d’abord les méthodes générales avant d’aborder les méthodes spécifiques. 


1. Généralités sur la résolution des équations f(x) = 0 


1.1. Localisation des racines des équations 


Avant d'entreprendre le calcul à proprement parler d’une ou de plusieurs racines, il convient 
de localiser soigneusement ces racines pour ne pas avoir à rencontrer de surprises désagréables, 
telles que l'arrêt inopiné de la machine... Plusieurs possibilités s'offrent à nous pour localiser les 
racines, en voici quelques-unes. 


a. On peut avoir recours à certains théorèmes de mathématiques nous fournissant ces renseigne- 
ments. Ce sont par exemple les théorèmes généraux concernant les polynômes orthogonaux 
relativement à une fonction poids w(x) donnée. 

b. On peut, dans le même ordre d'idée, effectuer une étude particulière de la fonction f(x) et 
en effectuer la représentation graphique. 

c. On peut aussi tabuler la fonction f(x) avec un pas variable pour tenter d’obtenir le maximum 
de renseignements. 

d. Dans certains cas, on pourra essayer d'utiliser les suites de Sturm (1803-1855), mais il faut 
bien dire que l'intérêt de telles suites est essentiellement théorique, et l’utilisation devient 
délicate même pour les polynômes à coefficients entiers (de quelques unités cependant) dont 
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le degré ne dépasse pas la dizaine. Nous examinerons en détail cette méthode dans l’annexe A. 
La localisation préliminaire des racines peut être plus difficile qu’il n’y paraît en première 
analyse notamment lorsque f(x) présente des extremums au voisinage de l’axe des x et 
cela sans préjuger qu’il y ait des racines ou non. Ces valeurs approchées des racines vont 
servir de point de départ à tout un ensemble de méthodes, le plus souvent itératives, qui 
convenablement utilisées vont permettre d'obtenir des valeurs précises des racines. 


1.2. La dichotomie 


Étymologiquement ce mot d’origine grecque signifie action de couper en deux. Le principe de la 
méthode est le suivant : supposons que l’on sache qu’une racine ait été localisée dans l’intervalle 
(a,b) et que cette racine soit unique dans cet intervalle. Nous allons étudier le signe de f(x) 
dans (a,b). Pour cela nous comparons les signes de f(a) et de f (4). S'ils sont identiques cela 
signifie que la racine est comprise dans l’intervalle (542,b) ; s'ils sont différents cela veut dire 
que la racine appartient à l’intervalle (a, atè J: On recommence la procédure dans l'intervalle où 
se situe la racine, mais on s'aperçoit que la taille de l'intervalle a été divisée par deux. On va 
poursuivre ainsi jusqu’à ce que l’on obtienne la précision souhaitée. Il est facile de connaître le 
nombre de tours que doit comporter la procédure à partir du moment où lon sait quelle est la 
précision de la machine utilisée et que la racine a fait l’objet d’une localisation raisonnable. 


Combien de fois devons-nous répéter la division de l'intervalle par deux? — Désignons par zo 
la racine : f(xo) = 0, et par (a, b) l'intervalle sur lequel on exécute la dichotomie, xo appartenant 
à (a,b). 

Après n tours, la dichotomie définit l'intervalle minimum €; qui sera le dernier susceptible de 
modifier effectivement la valeur zo, c'est-à-dire : 


= {hs G) 
(5) <w7. 


L'inégalité (a) définit le nombre de tours à effectuer pour obtenir la précision optimum, soit 
en passant aux logarithmes : 


soit en valeur relative : 


b-a 
To 


E1 


To 


0,301n — log, b <p, 


b-a 


| 1 
soit encore : n = 5301 (2+1 010 


Comme on a effectué une localisation de x telle que Si a 


soit de l’ordre de quelques unités, 


disons 10 pour fixer les idées (ce qui résout la plupart des cas réels rencontrés), n sera de 
l’ordre de : 


1 


=g P +1). 


Si p vaut 9, on trouve alors 33 tours de calcul, si p vaut 15 on obtient 53 tours de calcul. 
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Comme le montre l’expression donnant n, quand bien même la dynamique de l'intervalle 
serait multipliée par 10, cela ne ferait qu’ajouter une unité à p + 1, ce qui ne changerait pas 
grand-chose, et, dans l'exemple précédent, on trouverait alors 36 et 56 tours. 

Quoi qu'il en soit, la prudence la plus élémentaire exige toujours de reporter la prétendue 
racine dans l'équation et d’afficher le résultat... À ce sujet, encore une remarque : quel doit être 
l’ordre de grandeur de f(x)? 

On s'attend à trouver zéro, mais en général il n’en sera rien. Cela dépend de la fonction f(x) 
dont le calcul est agrémenté d’une erreur congénitale liée d’une part aux approximations utilisées 
par l'algorithme, d’autre part aux propagations des erreurs de troncature entre autres. Dans les 
centre de calcul, il est possible de consulter une documentation fournie par le fabricant de logiciel 
qui informe l'utilisateur sur ce type d’erreur. Pour des valeurs de l’argument appartenant à un 
certain domaine, un écart type est fourni, car il s’agit dans ce cas d’une erreur statistique. 

Comme f(xo) = 0 et f(xo + £1) = 0, un développement au premier ordre donne l’ordre de 
grandeur de f(&0 + €) : 


f(æo + £1) = f(xo) + E1 f' (£0), 
d’où f(xo +€1) — f(ro) © e1 f (£0) © 10 Pro f' (z0). 


Cette technique est simple à mettre en œuvre car elle ne fait appel qu’au calcul de la fonction 
elle-même, en outre elle offre l’avantage de conserver la suite des solutions approchées dans le 
voisinage retenu ce qui n’est pas le cas avec d’autres méthodes comme celle de Newton par 
exemple. Sur le Web (=) on trouvera le programme dichot.c réalisant la recherche de racine par 
dichotomie. 


1.3. Méthode d’approximations successives ne faisant 
intervenir que la fonction 


Le problème qui consiste à rechercher la racine d’une équation f(x) = 0 dans un certain domaine 
peut être modifié en ajoutant simplement x à chacun des deux membres, soit : f(x) + x = x. 
Par goût de la simplicité, on peut poser f(x) + x = g(x) sans changer quoi que ce soit. 

Nous allons décrire une méthode itérative qui ne fait apparaître que la seule fonction f(x) (ou 
g(x)) à condition toutefois que la fonction f(x) obéisse à certaines règles de régularité telles que 
la continuité et la dérivabilité (dérivée première continue). À partir de la première approximation 
£o obtenue par un des procédés proposés précédemment, on forme la suite : 


Pour que cette technique soit efficace, il est indispensable que la suite des x} soit convergente. 
Dans l’hypothèse où f(x) est continue et où la suite des x; converge, alors la limite de la suite 
que nous désignerons par x* est racine de f(x) = 0. En effet, quand k tend vers l'infini zx 
et te11 tendent vers x*. La continuité de f(x) entraîne celle de g(x) qui entraîne à son tour 


*http://www.edpsciences.com/guilpin/ 
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que limk Tk+1 = limg(xx) = x* = g(x*). Maintenant il nous faut examiner quelles sont les 
conditions qui assurent la convergence des £p. 
À la suite des x4 associons la série des uz définie ainsi : 


Un = Tn — n-i avec Up = To. 


On peut d’ores et déjà remarquer que la convergence de la série un entraîne celle de la suite £n 
et que la suite x, et la série associée un admettent la même limite x*. En effet si nous appelons 
Sp la somme des (p + 1) termes de la série, nous avons : 


p 
Sp = ` Uk = Tp, 
k=0 


ce qui démontre la dernière proposition. 
Développons le terme général ux de la série : 


Uk = Ek — Tk-1 = J(Tk-1) — gs): 
Appliquons le théorème de Rolle à la dernière expression, cela donne : 
Uk = g(2k-1) — g(xe-2) = (Lk-1 — £k-2)9' (E) 


avec £ compris dans l'intervalle (xx_1 — 4-2). En utilisant la relation de définition de la série, 
nous pouvons écrire : 


uk = ugg (£). 
La règle de d’Alembert (1717-1783) va nous donner la condition de convergence de la série ux : 


u 
LT, 


Uk—1 


On en déduit que l'algorithme converge lorsque la condition |g'(£)| < 1 est vérifiée dans tout 
le domaine voisin de la racine dans lequel on effectue les itérations. 


1.4. Généralisation de la méthode 


Au cas où |g'(£)| > 1, la suite des itérations est divergente. Pour pallier cet inconvénient, au 
lieu d'ajouter z aux deux membres de l'équation f(x) = 0, il suffit d'ajouter mx et de choisir 
convenablement m pour que la convergence soit assurée. Nous pouvons écrire : f(x)+mx = mx, 
puis l’on pose f(x) + mx = g(x); d’où la nouvelle suite des £y : 


pe Men, 
m 


La condition de convergence de la suite des z est : 


fF'(z)+m 
m 


g'(tk-1) 
m 


< 1, soit encore : 1 < 


< +1. 


Il est toujours possible de choisir m positif ou négatif, de taille suffisante, pour assurer cette 
double inégalité à condition que la dérivée soit bornée et que f{x*) Æ f'(æ*) si x* est une racine. 
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a — Représentation géométrique de la méthode — On porte sur le même graphe les fonctions 
y = mz et y = g(x) = f(x) + mz. 

Cela va nous permettre de localiser non seulement la ou les racines mais aussi de connaître la 
dérivée au voisinage des racines donc éventuellement d’ajuster le coefficient m selon le cas qui 
se présente. Sur le graphe de la figure 4.1, on peut suivre la suite des points générée à partir de 
la première approximation zo : 


To g(zo) 
xı = g(xo) g(æ1) 
£2 = g(x1) g(x2) 
Tn = gl£n-1) g(Tn) 


Figure 4.1. Méthode par itérations. 


b — Précision sur la détermination de la racine — On désigne par M la limite supérieure de 
la valeur absolue de la dérivée dans le domaine où l’on effectue les itérations. Nous pouvons 
donc écrire : 


|jun| = Mlus-1lavec M < 1. 


Si nous arrêtons les itérations après n tours, nous aurons : 


et l’on déduit que l’erreur e sur la racine x*, en adoptant x* comme approximation, est : 


o0 
e= J Up. 


p=n+1 
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On en conclut que : 
o0 
2 3 
e< ` lup] = lun| |K + K? +K? +| 


p=n+1 


On reconnaît une progression géométrique de raison K et de premier terme K. Donc : 


< lun 

e < [un — : 
rer 

Comme en général on arrête les itérations lorsque deux valeurs consécutives sont égales à la 

précision relative de la machine on peut alors écrire : 


Un Tn — Ln-1 


= 107?” 


Tn Tn 


K 
< tn 107”. 
e S |n TIK 
En pratique, on peut estimer K de la façon suivante : 


Le [8n = san) 
Ln — n-i 


Sur le Web C), on trouvera le programme itera.c qui calcule les racines par cette méthode 
itérative. 


1.5. La méthode de Newton (1643-1727) 


Nous avons déjà rencontré la méthode de Newton à propos du calcul de la racine carrée d’un 
nombre et il nous reste donc à généraliser cette technique à la recherche d’un zéro d’une fonction 
quelconque f(x). 

Supposons qu'un travail préliminaire nous ait permis de localiser une racine dans l'intervalle 
(a,b). On désigne par £o la première approximation de cette racine. Comme zo n’est qu’une 
approximation, la racine æ* que l’on recherche s'exprime de la façon suivante : &* = xo + ho. 
Nous allons chercher à calculer ho ou plus exactement une approximation de ho. Nous pouvons 
écrire : 


f(x") = f(xo + ho) = 0. 


Linéarisons le problème, c’est-à-dire que nous développons la fonction f(x) au premier ordre 
au voisinage de xo. Nous obtenons : 


F(xo + ho) = 0 = f(x0) + hof’ (z0) 
ce qui va permettre d’obtenir la valeur approchée de ho : 


f(xo) 


ho = F(a) à 


* http://www .edpsciences .com/guilpin/ 
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Cette valeur nous permet d’obtenir, sous certaines réserves, une meilleure approximation que 
nous écrivons : 


Rien ne nous empêche, excepté toutefois l'absence éventuelle de convergence, d’itérer succes- 
sivement la procédure jusqu’à ce que l’on obtienne la racine x* avec la précision souhaitée. On 
aura formé la suite : 


Fer) | 


Tk+1i — Tk — Flan) 


Dans la mesure où l’on dispose non seulement de la fonction mais aussi de sa dérivée on peut 
espérer obtenir une vitesse de convergence rapide du moins dans le cas où les racines sont simples. 
Au reste, l'interprétation géométrique est très parlante. Représentons la courbe y = f(x) sur un 
diagramme (cf. Fig. 4.2) ainsi que la première approximation xç. La linéarisation du problème 
consiste à remplacer un arc de courbe de f(x) par un segment de droite qui est tangent à la 
courbe dans le cas général. Traçons la tangente au point [xo, f(xo)]. Elle coupe l’axe des x au 
point zı donné par l'expression : 


Ds de) 
f'(xo) 
f(x) 
Figure 4.2. Méthode de Newton. O 


La répétition du processus nous permet d'obtenir sans problème les points suivants qui sont 
T2, 3; 


a — Ennuis possibles avec la méthode de Newton — En l'absence de difficultés, la méthode 
de Newton assure une convergence très rapide de la suite de x4. Dans le cas de racines simples, la 
convergence est même quadratique ce qui confère à cette technique un intérêt particulier quand 
on dispose déjà d’un chiffre significatif. Nous utiliserons cet algorithme pour réaliser une partie 
de la fonction de bibliothèque calculant la racine carrée, et nous verrons ultérieurement dans 
quelles conditions. 
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Malheureusement des problèmes peuvent surgir qui sont liés à la nature de la fonction, 
de sa dérivée ainsi que du point £o à partir duquel s'effectuent les itérations. En effet dans 
le domaine voisin de la racine où l’on travaille, la courbe peut présenter des changements 
de concavité ou encore présenter des extremums. Si un point x; tombe au voisinage d’un 
extremum, alors f'(x) est proche de zéro, et la technique de Newton nous donnera un point 
Zķ+1 qui pourra être très loin de la solution recherchée. Pour peu qu’il y ait une racine 
dans le voisinage de zx+1, on aura toutes les chances de la calculer en croyant être dans un 
autre voisinage. Cela laisse la porte ouverte à quelques désastres possibles... Lorsque l’on se 
trouve dans un cas analogue, on doit obligatoirement le savoir avant d’entamer les calculs 
puisqu'on a pris les précautions d’usage. Pour éviter qu’au départ la suite générée présente 
des instabilités ou des divergences locales, on combine la méthode de Newton avec celle des 
parties proportionnelles. 


b — Estimation de la précision de la méthode de Newton — La plus grande sagesse veut que 
lon reporte la valeur x4 que l’on estime être une approximation raisonnable de la racine dans la 
fonction f(x). On note : ex = f (xp). Si ex est de l’ordre de grandeur de l'incertitude introduite 
par le calcul de f (zx), cela ne signifiera certainement pas que x4 soit une racine, mais qu’il n'y a 
pas de contradiction avec le fait qu’elle puisse en être une. En revanche, si ex est trop grand, il y 
a lieu de s'inquiéter et d'examiner de nouveau le problème. C’est une attitude identique à celle 
qu’on adopte lorsque l’on fait usage de la preuve par 9 ou par 11. Seul un résultat négatif donne 
la certitude d’une erreur, tandis qu’un résultat positif ne donne pas la certitude d’une exactitude 
mais seulement une probabilité plus ou moins élevée pour que se présente cette éventualité. 
Deux cas peuvent se présenter : ou bien la suite générée est une suite encadrante, ou bien 
la suite générée est une suite monotone croissante ou monotone décroissante du moins à partir 
d’un certain rang. 
e La suite est encadrante -— Il faut bien avouer que c’est un cas d’école qui se présente 
rarement, car cela impose que la racine soit aussi un point d’inflexion. On retiendra les deux 
dernières valeurs de zx et zx_, car on sait que la racine se situe entre ces deux dernières 
valeurs entachées toutefois des inévitables erreurs d’arrondi et des erreurs dues à l’approximation 
des fonctions de bibliothèque. Du fait de ces erreurs, il est fort possible que l’on trouve deux 
limites en machine. Bien entendu, l’estimation de l'incertitude est liée intimement à la différence 
|Ek — æx-1| sans oublier les erreurs entachant les calculs de f(x4_1) et f(x). À partir de là, on 
retombe dans le calcul standard des erreurs. 
e La suite est monotone à partir d’un certain rang — À partir d’un certain rang r, tous les 
Tq générés sont donc classés par ordre croissant ou décroissant. Il faut s’assurer que lorsque deux 
valeurs consécutives xx et tz41 sont égales à la précision de la machine, le reste des opérations 
négligées n’apporterait plus de contribution à la précision du calcul, autrement dit il faut que : 


f(x) 
J'(æx) 


œ Lee] 


5 |Ek+1 = Tkl z 5 


j=k+1 j=k+1 


soit négligeable. 

Comme il n’y a aucune raison particulière pour que la tangente soit verticale, la seule condition 
de convergence est que f (xp) tende effectivement vers zéro quand k tend vers l'infini. C’est alors 
que la précision de la machine utilisée intervient ainsi que la nature de la fonction f(x). Pour 
obtenir une estimation raisonnable de l’erreur, il faudra chaque fois faire une étude particulière 
dont il est possible de donner les grandes lignes : il est facile de donner à la valeur approchée 
xæ* de la racine une suite d’accroissements + dx, +2 dz, +3 dx... , +k dx avec dx = 10 ?x* 
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où 107? est la précision relative de la représentation en machine. Peu de valeurs suffisent. On 
tabulera alors la fonction f(x) pour ces différentes valeurs et l’on notera l'intervalle dans lequel 
s'effectue le changement de signe. Compte tenu de la précision de la représentation on pourra 
estimer un intervalle dans lequel se trouve effectivement la racine. C’est une évaluation directe 
de l'erreur qui constitue un garde-fou contre les mauvaises surprises. 

On trouvera sur le Web (*) le programme newtonid.c qui calcule les racines par la méthode 
de Newton. 


1.6. Méthode de Newton et des parties proportionnelles 


En général, cette méthode est utilisée lorsque dans l’intervalle où l’on recherche la racine, peut 
se trouver un point d’inflexion ou un extremum. Donc, pour éviter que la valeur de la dérivée 
apparaissant dans la méthode de Newton notamment durant les premiers tours d’itération, ne 
provoque des instabilités préjudiciables à la bonne conduite du calcul, on lui associe la méthode 
des parties proportionnelles qui ramène les valeurs des approximations dans un domaine que 
l’on espère généralement plus raisonnable. Soit x9 la première approximation et [xo, f(xo)] le 
point À sur la courbe y = f(x). On effectue une deuxième approximation : 


— F(xo) . 
J"(æo) 
à laquelle correspond le point B sur la courbe. 
La méthode des parties proportionnelles consiste à choisir comme approximation suivante le 
point d’intersection de laxe des x et de la droite joignant les points A et B. Désignons par z2 
l’abscisse de ce point, nous obtenons : 


pe zof(r1) — t1f(xo) | 
f f(z1) — f (z0) 


À nouveau on calcule le point z3 par la méthode de Newton puis le point z4 par la méthode 
des parties proportionnelles et ainsi de suite (cf. Fig. 4.3, page suivante). 

On trouvera sur le Web (*) le programme newtonpp.c qui calcule les racines au moyen de la 
méthode de Newton et des parties proportionnelles. 


TL] =T 


Remarque : Les ennuis de stabilité liés à l’usage de la méthode de Newton naissent essentielle- 
ment du choix de la première approximation qui parfois est trop éloignée de la racine que l’on 
recherche ou encore quand une abscisse de la suite formée se situe trop près d’un extremum. 
Quand on tient un certain nombre de chiffres significatifs, il faut rappeler qu’en l’absence de 
racines multiples, la méthode converge quadratiquement et pratiquement seules les erreurs de 
troncature viennent altérer la précision du résultat. 


2. Résolution d'un système non linéaire de deux équations à deux 
inconnues 


Nous nous proposons de résoudre un système non linéaire de deux équations à deux inconnues 
que nous écrivons : 


*http://wuw.edpsciences.com/guilpin/ 
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f(x) 


Figure 4.3. Méthode de Newton 
et des parties proportionnelles. 


Comme chaque fois en pareil cas, il sera nécessaire de commencer l’étude par une représenta- 
tion graphique laquelle permettra de se faire une idée des éventuelles difficultés qui peuvent se 
présenter, et de déterminer une première approximation (to, yo). Le système étant non linéaire, 
nous allons commencer par le linéariser puis par effectuer des itérations sur le système linéarisé. 
Nous admettrons que les fonctions sont deux fois continûment différentiables dans un domaine 
D du plan (x,y) qui contient la racine recherchée et que le déterminant fonctionnel (ou encore 
le jacobien) : 


Of 3g BE O4 


J(x,y) = roy du 0e 


est différent de zéro pour la valeur de la racine. 


2.1. La méthode de Newton 


Nous généralisons sans difficulté la méthode étudiée lors de l’étude de l’équation f(x) = 0. Soit 
zo et Yo une première approximation. On note par dx et dy les écarts à la solution exacte 
c’est-à-dire : * = zo + dzo et y* = Yo + dyo. 

Le système s'écrit : 


f(a*,y*) = 0 = f(xo + dzo, Yo + dyo) 
g(z*,y*) = 0 = g(xo + dzo, Yo + dyo). 


Pour linéariser le problème il suffit d'effectuer un développement au premier ordre des 
fonctions f et g au voisinage de zo et yo. Nous obtenons : 


ð ð 

f(xo, y0) + dso? + awg = 0. 
ə 8 

g(xo, yo) + des + dus, = (. 
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Il nous reste à résoudre le système linéaire de deux équations à deux inconnues pour obtenir 
dzo et dy. On trouve alors : 


of _ ,0g 
dz -o oy y Oy 
° Bf ög _ƏF ðg 
Ox ðy y 0x 

ð ð 
Pee 
dyo = yr he 
F 3g _ OF ðg 
Ox Oy  Oy Or 


expressions que l’on calcule au point (xo, yo). 
Bien entendu on obtient dans des conditions convenables une meilleure approximation : 


1 = To + dzo 


Yi = Yo + dy 


à partir de laquelle il va être facile de réitérer la procédure. Ici encore la méthode convergera 
quadratiquement en l'absence de racines multiples. Cependant il existe des méthodes à conver- 
gence simple qui font apparaître elles aussi les dérivées. Au premier examen on peut s'interroger 
sur l'intérêt présenté par de telles méthodes puisque, avec des moyens semblables, les méthodes 
quadratiques sont beaucoup plus performantes. Ceci n’est vrai qu’en apparence car dans certains 
cas les instabilités de calcul rendent inopérantes les méthodes quadratiques tant qu’un certain 
degré de précision n’a pas été atteint. En revanche ces problèmes disparaissent avec les méthodes 
à convergence simple. Du reste, comme la vitesse de convergence est éventuellement une source de 
préoccupation, il est intéressant d’accélérer la convergence de la suite formée en se servant d’un 
algorithme accélérateur de la convergence des suites : l’epsilon-algorithme par exemple. C’est 
par ce procédé que nous calculons des diagrammes de phase théoriques lorsque les conditions 
deviennent délicates. 
Le lecteur trouvera le programme newton2d.c sur le Web (EL 


2.2. La méthode de Kacmarz (1937) 


Nous allons présenter la méthode, d’abord élaborée pour les systèmes multilinéaires, sur un 
système linéaire de deux équations à deux inconnues à partir duquel on pourra effectuer 
toutes les généralisations souhaitables : soit la transposition au cas d’un système multilinéaire, 
soit la transposition au cas non linéaire que l’on traitera au moyen d’une procédure itérative 
s'appliquant sur le système linéarisé. 

Soit le système 


a1® + biy + € = 0 (droite D:) 
a£ + boy + c2 = 0 (droite D2) avec aibz Æ ab. 


Ce système admet une solution désignée par (x*,y*). Partant d’une première approximation 
A de coordonnées (xo, Yo), on projette ce point sur la droite Dı, on obtient le point A de 


*http://www.edpsciences.com/guilpin/ 
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coordonnées (z1, y1). Ensuite, on projette le point A: sur la droite Dz ce qui nous donnera le 
point Az. On poursuit en projetant le point Az sur la droite D, et ainsi de suite jusqu’à ce que 
l’on obtienne la précision désirée. À présent écrivons les coordonnées de la suite des points ainsi 
formée. Nous avons : 


T1 = Lo — se 
5a rA 
bi Rı 
W=Y— z7 p avec Ri = azo + b1Yo + c1. 
di 0x 


Le point (x1, y1) est projeté sur la droite Do, à partir duquel on calcule le point (z2, y2) : 


To =T aR 
RE +o 
ba R2 
= y — avec Ro = azı +b C2, 
Y2 = Yi a+ av 2 21 + OaYi + C2 


et ainsi de suite. Il est possible de montrer que cette méthode est toujours convergente mais 
qu’elle est seulement à convergence linéaire. L'intérêt de cette méthode repose avant tout sur le 
fait qu’elle est transposable aux équations non linéaires. 


Application au cas des équations non linéaires — Le système des équations linéarisées que 
nous avons obtenu au paragraphe traitant de la méthode de Newton sera simplement résolu par 
la méthode de Kacmarz. Nous avions : 


ð Ô 
f(xo, Yo) + dzos aP ang. = 0 
Ô ô 
g(£o, Yo) + do + dar = 0 
Si l’on pose : 
Of 
Q1 = Əz 
3g 
û = Ər 
Of 
b = 
1 y 
ðg 
bo = I 
2 ðy 
Rı = f(x,y) 
Ro = g(x,y), 


on obtient les suites des x4 et des yẹ données par les expressions : 


ai Ri 
RER RE 

bi Rı 
Yk = Yk-1 — a Et 
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expressions calculées au point (£k—1, Yk—1) 


a2 Ro 
ET: 
m b2 R2 
Yk+1 = Yk — a240 


expressions calculées au point (£ķ, yk). La convergence n’est plus systématiquement assurée 
comme dans le cas linéaire. Dans certains calculs, elle a retenu notre attention pour sa grande 
stabilité, et nous avons pu accélérer la vitesse de convergence au moyen de l’epsilon-algorithme. 

Le lecteur trouvera sur le Web®) le programme kacmarz.c permettant l'usage de cette 
procédure. 


3. Racines d’un polynôme 
3.1. Méthode de Bairstow (1914) 


Ici encore, nous allons limiter nos préoccupations à l’étude des polynômes à coefficients réels 
que l’on notera de la façon suivante : 


PAx) = aox” + aix”! + aoz”? +- + anit + an 


avec comme condition quasi évidente ao # 0. Nous savons qu’un polynôme de degré n admet 
n racines réelles ou complexes et nous allons étudier une méthode très élégante pour obtenir 
lesdites racines. 

L'idée générale du calcul repose sur le schéma suivant : dans le cas où n est supérieur à deux 
on peut diviser P,(x) par un trinôme T{x) de la forme : 


T(x) =z? + uz +v 
ce qui nous permet d'obtenir une expression nouvelle de P,(x) à savoir : 
Pala) = T(£)Qn-2(£) + Ax + B 


où Qn-2(x) est un polynôme de degré (n — 2) et (Az + B) un monôme exprimant le reste de la 
division. Nous allons faire en sorte que A et B qui sont des fonctions implicites de u et v soient 
nulles ; on réalisera cela en ajustant convenablement les valeurs de u et v apparaissant dans le 
trinôme. Lorsque nous y serons parvenus, le polynôme s'écrira sous la forme d'un produit strict 
d’un trinôme et d’un polynôme de degré (n — 2). Ainsi, les racines du trinôme seront également 
les racines du polynôme P,(x), et l’on sait qu’il n’y a pas de difficultés particulières à calculer 
les racines d’un trinôme. 

Rien ne nous empêche de faire subir le même traitement au polynôme Qn-2(£), et ainsi de 
suite jusqu’à ce que Q,(x) soit un polynôme de degré 1 ou 2. En définitive, tout le problème 
repose sur la détermination des paramètres u et v qui annulent simultanément À et B. Nous 
avons donc à résoudre un système non linéaire de deux équations à deux inconnues que nous 
écrivons : 


A(u,v) = 0 
Blu,v) =0 


*http://wuw.edpsciences.com/guilpin/ 
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système que l’on résoudra par la méthode de Newton ou de Kacmarz, de toute façon au moyen 
d'itérations. Si uo et vo constituent une première approximation, la méthode de Newton nous 
permet de calculer les corrections du et dv qu’il convient d’apporter, soit : 


pè4 _ 49B 
du = ðv ðv 
D 
A9B == p°A 
dv = Ou Ou 
D ? 


A ðB OA 0B 
Ou Ov Ov Ou 


avec D = 


les fonctions étant calculées au point (wo, vo). 

Nous serons effectivement capable de calculer du et dv dans la mesure où nous serons 
capable d'exprimer À et B ainsi que leurs dérivées partielles et c’est sous cet aspect que nous 
allons envisager les calculs. Explicitons le polynôme Q,-2(x) : 


Qn_2(x) = boz”? + br +... + bn-2. 


Par identification de P,(x) et de T(x)Q,-2(x) + Ax + B on obtient les relations de récurrence 
suivantes : 


bo = æ 

bı = @— ubo 

bo = a — ubi = vbo 

bj = Qj ubj_1 ra vbj—2 
bn-2 = Gn-2 — Ubn-3 — Vbn—4 
A = an-ı — Un-2 — Vbn-3 
B = An — Vbn 2 


À présent nous savons calculer À et B en fonction des coefficients du polynôme P,(x) et des 
paramètres u et v. Calculons maintenant les dérivées partielles de À et B par rapport à u et v 
lesquels sont — rappelons-le — des paramètres indépendants. Pour ce faire, dérivons la forme 
générale de la relation de récurrence par rapport à u : 


db; db;-1 db;-2 
= —b;_ J J 
ðu 1 Où Du 
et posons 
ðb; 
Dur 


nous obtenons ainsi la relation de récurrence suivante : 


Cj—1 = —b; 1 — UCj—2 — VC;_3. 
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Nous explicitons à nouveau l’ensemble des relations : 


Co = —bo 

C1 = —bı — Uco 

C2 = —bz — UC] — VCo 

Cn-3 = —bn 3 — UCn—4 — VCn-5 
ðA 

A = bn—2 — UCn—3 — VEn—4 
ðu 

ƏB 

TON = —UCr-3 

ðu ý 


Recommençons le calcul en tout point semblable en dérivant la relation de récurrence initiale 
par rapport à v. 


„ĉi y 5-2 


pe 
Ov j=l ðv ðv 
Posons 
ðb; 
ee on 


ce qui nous permet décrire la relation de récurrence : 


d; = bj 2 udj 3 vd; 4. 


qu’à nouveau nous explicitons complètement : 


do —bo 

di = —bı = udo 

dz = —bo = udi i vdo 

dn—4 = bn 4 udn 5 vdn 6 
a = bn 3 udn 4 vdr 5 
Ov 

ƏB 

v Æ —bn-2 = Ulaid, 


Remarquons immédiatement que les suites c; et dj sont identiques, il n’est donc pas nécessaire 
de calculer la suite d}, et l’on obtiendra les dérivées partielles par rapport à v à partir de la suite 
des cj : 


ae bn 3 udn—4 — vdn-5 = Cn-3 
ðv 

Dry Cl: 

dv = n—2 n—4: 


3.2. Conduite du calcul 


Il nous faut donc calculer les fonctions À et B ainsi que leurs dérivées partielles. Connaissant 
une première approximation (wo,vo) nous sommes donc en mesure de déterminer les termes 
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correctifs du et du à chaque tour d’itération (on utilisera les relations de Newton par exemple). 
Bien sûr nous recommençons le même calcul à partir des nouvelles valeurs : 


U = uo + du 
vı = Vo + dv 
et ainsi de suite. Nous avons défini une procédure itérative que nous arrêterons en machine 


lorsque du/u et du/v seront inférieurs à la précision de la représentation en machine. 
Regroupons la liste des opérations utiles (cf. Tab. 4.1.). 


Tableau 4.1. Liste des opérations utiles. 


bo = € Co = —bo 
bı = 4 — ubo C1 = —b; — UC, 
b2 = @— ubi = vbo C2 = =b — UC] — VC 
b; = OG@j— ub;_1 ou vbj—2 Cj = —b; — UCÿ-3 — VC;-2 
bn-2 = An-2 — Ubn-3 — Vbn-4 Cn-3 = —0n-3 — UCn-4 — VCn-5 
OA 
A = ün 1 — ubr 2 — Vbn-_3 ðu = bn-2 UCn-—3 UCn—4 
ðB 
B = an— vbn- — = —Vn-3 
ðu 
ðA 
— = n3 
ðv `i 
ðB 


Comment choisir les valeurs de départ uo et vo? 
Une bonne méthode pour débuter les itérations consiste à choisir les valeurs suivantes : 
Gn—1 An 


ug = et vo = á 
An-2 An—2 


On calcule la suite des ux et des vx jusqu’à obtenir la précision souhaitée. Pour réaliser ces 
opérations il ne faut surtout pas utiliser de tableaux pour stocker les bẹ et les ck, car nous 
n’avons besoin que des trois dernières valeurs calculées. Il suffira alors de réaliser des décalages 
sur seulement trois variables. Cette remarque permet de gagner un temps considérable en calcul; 
ensuite quand on a obtenu l’annulation du reste Ax + B, on calcule la suite des by dans le même 
tableau que celui qui a servi à stocker les valeurs des ag. Alors il est possible de pouvoir chercher 
deux nouvelles racines grâce à la même procédure. Dans le but de simplifier l'usage des relations 
de récurrence, on programme les relations générales données par b; et c;, et l’on démarre les 
calculs avec : 


bı —=b 2 —=0 et C1 = Ck—2 = Ô. 
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Mise en œuvre de la méthode — On trouvera sur le Web (*) les programmes bairstow.c et 
bairstow.h réalisant l'algorithme de Bairstow. Toutefois ces programmes appellent plusieurs 
remarques : 


1. Le programme peut être mis en défaut lorsque le polynôme présente des racines multiples et 
notamment des racines doubles car le jeu des erreurs peut nous faire basculer vers des valeurs 
négatives du discriminant et peut nous donner l'illusion de deux racines complexes conjuguées. 
Cela mérite évidemment un examen attentif. En fait l’erreur absolue sur le discriminant est 
de l’ordre de 10715 et par conséquent la partie imaginaire sera de l’ordre de 1078. 

2. Hormis l'ennui précédemment cité, il n’y a pas lieu de procéder à une détermination locale 
préalable des racines qui peuvent du reste être complexes. 

3. On pourrait mettre en œuvre une méthode qui utilise un binôme au lieu d’un trinôme, mais 
seules seraient calculées les racines réelles du polynôme à coefficients réels, ce qui ôte tout 
attrait à ce procédé. Cependant, dans le cas où les coefficients du polynôme sont complexes, 
la réécriture de la méthode de Bairstow appliquée à la division par un binôme donne une 
excellente manière d'opérer (voir les problèmes). 


3.3. Racines d'un polynôme et valeurs propres d’une matrice 


L'usage des mathématiques veut que la détermination des valeurs propres des matrices passe 
par l’intermédiaire de l'équation caractéristique dont on recherche ensuite les racines. L’équation 
caractéristique est en fait un polynôme dont les zéros sont les valeurs propres de la matrice. Ainsi, 
quand nous aurons obtenu l'équation caractéristique, la méthode de Bairstow nous donnera les 
valeurs propres de la matrice. 

Ce n’est pas la meilleure technique pour calculer les valeurs propres d’une matrice et 
l’on étudiera d’autres méthodes directes qui nous permettront de les obtenir. Cependant, 
réciproquement, si l’on sait associer une matrice carrée d’ordre n à un polynôme de degré n 
qui est le polynôme caractéristique de ladite matrice, on pourra utiliser les méthodes directes 
de calcul des valeurs propres pour obtenir les zéros des polynômes. 

Pour simplifier le problème sans pour autant nuire à la généralité, on s’intéressera aux 
polynômes à coefficient principal réduit que nous écrirons donc : 


IL, (x) = z” + art + art? +... 4 an _1T + An = 0. 


Il suffit alors d'associer la matrice suivante (une des formes canoniques de Frobenius (1849 
1917)) : 


0 1 0 0 0 0 . 0 
0 0 1 0 0 0 . 0 
= 0 0 0 1 0 0 . 0 
0 0 0 0 1 0 . 0 
0 0 0 0 0 0 1 
An An—1 An-2 An—3 An—4 ce  —@1 


La première surdiagonale de cette matrice est constituée de 1 et la dernière ligne est formée par 
les opposés des coefficients du polynômes caractéristique ordonnés selon les puissances crois- 
santes, partout ailleurs il y a des zéros. On montre que (—1)"II, (x) est l’équation caractéristique 
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de cette matrice. Il est facile de former cette matrice puis de chercher ses valeurs propres par 
une méthode directe, on obtiendra alors les zéros de II, (x). 

On donne sur le Webl*) froben.c un programme qui forme la matrice À à partir des 
coefficients du polynôme. Ceci appelle une remarque importante. Si la matrice est mal condi- 
tionnée, nous aurons beaucoup de difficultés à calculer des valeurs propres correctes. Le lien 
entre l'équation caractéristique et la matrice associée montre également que les coefficients des 
polynômes peuvent aussi être mal conditionnés et dans ce cas les algorithmes peuvent donner 
des résultats aberrants. 


*http://wuw.edpsciences.com/guilpin/ 
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Ce chapitre est constitué de deux rubriques consacrées l’une à la résolution de systèmes linéaires, 
l’autre au calcul des valeurs propres des matrices carrées. Nous allons voir comment résoudre ce 
premier problème selon deux méthodes générales, puis nous examinerons une solution propre aux 
«matrices » de Vandermonde rencontrée en interpolation. La résolution d’un système linéaire 
nous conduira directement au calcul d’un déterminant et à l’inversion des matrices (carrées). 
Pour terminer, nous aborderons quelques méthodes de calcul des valeurs propres des matrices. 
Auparavant, nous traiterons des opérations élémentaires sur les matrices. 

Si l’on se réfère au calcul d’un déterminant d’ordre n selon la méthode de Cramer (1704-1752), 
on voit que ce procédé exige environ n! opérations ce qui devient rapidement irréalisable du point 
de vue pratique. Il nous faut utiliser des méthodes beaucoup plus économiques et celles que nous 
présentons utilisent grossièrement n° voire n opérations. Du reste le dénombrement exact est 
facile à obtenir en modifiant très légèrement les programmes proposés : il suffit d'ajouter un 
compteur d'opérations. 

Tout au long de ce chapitre, on note par des lettres majuscules les matrices et les vecteurs, et 
par des lettres minuscules (généralement indicées) les éléments des matrices et les composantes 
des vecteurs. 


1. Multiplication de deux matrices 


Soient deux matrices A(n,m) et B(m,l) expressions dans lesquelles le premier terme de la 
parenthèse représente le nombre de lignes et le second le nombre de colonnes. C (n, l) le produit 
des matrices À et B s'écrit : 


C(n, l) = A(n,m)B(m,l), 


avec 


m 


Cjk = X Qjibik- 


i=1 


Le nombre d'opérations est environ 2m x n x l. On trouvera le sous-programme multma.h 
calculant le produit de deux matrices sur le Web (=), 


*http://www.edpsciences.com/guilpin/ 
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2. Résolution d’un système linéaire 


On considère un système linéaire de n équations à n inconnues que l’on écrit sous une forme 
matricielle : 


AX =B. 


Les coefficients de la matrice A (d’ordre n) sont notés selon l’habitude classique : ax (dans 
l'ordre ligne colonne). X (de composantes z;) est le vecteur des inconnues et B (de composantes 
b;)le vecteur second membre. La notation du vecteur inconnu est sans intérêt dans la manière 
dont on résout le problème et seules les grandeurs que nous allons manipuler sont les ay et 
les b;. 


2.1. Méthode des pivots 


Nous allons traiter simultanément l’ensemble des données du problème et pour ce faire nous 
formons un tableau T(A, B) en juxtaposant les éléments de la matrice À et les composantes du 
vecteur B selon l’expression ci-dessous : 


Gi1 G12 G13 Gin b 
G21 Q22 Q23 azm bz 
_ |031 032 Q33 >.> @3n b3 
T(A, B) = b 
Q41 Q42 Q43 Gan 4 
Anl An2 An3 Ann bn 


On voit que le tableau T(A,B) représente une forme multilinéaire avec les propriétés 
suivantes : 


a. La permutation de deux lignes ne change rien au tableau. 

b. La multiplication d’une ligne par un nombre ne change rien au tableau. 

c. L’addition terme à terme de deux lignes ne change rien au tableau, 

d. La combinaison linéaire de deux lignes du tableau ne change rien au tableau. 


Quand le système linéaire est soluble et résolu, le tableau T(A, B) se présente sous la forme : 


100 0 S 
010 0 S 
_|o 0 1 0 S 
FH 50:90 0 S 
0 0 0 1 Sa 


où I est la matrice unité d’ordre n et S le vecteur solution. 
Comme T(A, B) = T(I, S), nous allons voir comment passer du tableau T(A, B) au tableau 
T(I, S) par les opérations linéaires décrites en a, b, c et d au moyen de la méthode des pivots. 
Nous allons transformer le tableau T(A, B) de telle sorte que nous obtenions le vecteur colonne 
(1,0,0,... ,0). Pour y parvenir il faut d’abord diviser la première ligne du tableau par l’élément 
ajı que l’on suppose différent de zéro. La première ligne s’écrit alors : 


1 1 1 1 
1 aiz CE ye Qin bi. 
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Pour annuler les autres termes de la première colonne, il suffit d’opérer ainsi : 

les éléments de la première ligne multipliés par a21 sont retranchés des éléments correspondants 
de la deuxième ligne. Ensuite, d’une façon tout à fait générale, les éléments de la première ligne 
multipliés par ax1 sont soustraits des éléments correspondants de la k° ligne. Donc, pour k > 1: 


Eon 1 (TEES 1 
Ag; = Aki — Ak1ü]; €t bp = bk — akibi. 


Les éléments de la première colonne du tableau transformé équivalent sont nuls pour k > 1, 
seul le premier élément vaut 1. Après cette première phase, le tableau s’écrit : 


1 1 1 1 
l aig Qis ... Gin bi 
1 1 1 1 
0 az Q3 ... @ən bə 
1 1 1 1 
T(A, B) = 0 a3 a33 ... G3n 03 
7/7 JO a a! al, bl 
42 43 án På 
1 1 1 1 
0 an2 an3 ünn bn 


À présent, nous allons traiter le deuxième vecteur colonne de la matrice A. Nous divisons 
toute la deuxième ligne par l'élément ai, à condition qu’il soit différent de zéro. Cette deuxième 
ligne devient : 


2 2 2 
0 a33 ... Qn b2 


ensuite, les éléments de la deuxième ligne multipliés par al, sont soustraits des éléments 
correspondants de la k° ligne, et cela pour k Æ 2. Ainsi on aura : 


E E e 2 I - 12 
aki = Aki — ak0; et Dé = bp — agobe. 


À présent la deuxième colonne du tableau a été transformée selon nos væux. | 

Il n’y a pas de difficultés à poursuivre de la même façon les transformations de la troisième 
ligne puis des lignes suivantes, et ainsi de suite jusqu’à la n° ligne. À la fin du calcul, nous 
obtenons la configuration souhaitée : 


0 b 
O b} 
0 b 
T(I, b”) = at 


Les b} sont les solutions recherchées du système linéaire. 

L'élément af}, qui se trouve sur la diagonale principale a vu sa valeur changer dynamiquement 
au cours des calculs tant que m est inférieur à k. Quand m = k, on procède à la division de la 
ligne k par cet élément qui porte le nom de pivot d’où le nom de la méthode. 

Au cours des calculs, nous avons supposé que le pivot rencontré n'était jamais nul. Qu’arrive- 
t-il si l’on rencontre un pivot nul? De deux choses l’une, ou bien la matrice n’est pas inversible 
et son déterminant est nul, ou bien elle est inversible et son déterminant est différent de zéro. 

Il nous est toujours possible de permuter la ligne k avec une des lignes qui suivent, donc 
numérotées de k + 1 àn. Il n’y aura d'intérêt à réaliser cette permutation que si au moins un 
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élément de la colonne k est différent de zéro. Si tel est le cas, on échange les deux lignes, rien 
n’est changé dans le tableau T et l’on poursuit les calculs. Si la permutation ne permet pas 
d’amener un pivot non nul, c’est que la matrice est singulière. Si, à partir de la k° ligne on 
ne peut plus permuter de lignes, la matrice est dégénérée d’ordre n — k. Seules k lignes ou k 
colonnes sont linéairement indépendantes. 


Remarque 1 : La prudence la plus élémentaire exige que l’on reporte la solution trouvée dans 
les équations d’origine afin de déceler éventuellement un écart sensible avec le second membre. 
Remarque 2 : Une matrice dégénérée possède une infinité de solutions. À bien y réfléchir, il 
est peu probable qu’un calcul de pivot amène la valeur zéro, tout simplement parce que le jeu 
du cumul des erreurs et des troncatures a peu de chances de réaliser un tel événement. Donc on 
risque fortement à un moment donné de diviser une ligne par un pivot qui aurait dû être nul 
sans qu'il le soit dans la réalité. Nous allons obtenir une solution parmi l’infinité de solutions 
possibles dans un tel cas. 


Comment prévenir une telle infortune? Il est nécessaire de détecter un tel dysfonctionnement, 
et, on peut y parvenir en exécutant plusieurs fois les calculs sur des présentations différentes 
du tableau obtenues en intervertissant les lignes. Ainsi on fera apparaître plusieurs solutions 
différentes du même système linéaire et notre attention sera attirée par sa singularité. 

Dans le cas où l’on ne rencontre pas un pivot nul, on peut évaluer de façon approchée le 
nombre d'opérations : n°. Sur le Web (*) on trouvera le programme systlin.c qui réalise le 
calcul selon la méthode des pivots. 


2.2. Méthode de la décomposition de la matrice A en un produit 
de deux matrices triangulaires 


Nous nous proposons de décomposer la matrice A en un produit de deux matrices triangulaires 
notées D et G où D est une matrice triangulaire inférieure et G une matrice triangulaire 
supérieure telles que À = DG, puis d'appliquer cette technique de décomposition à la résolution 
d’un système linéaire. Notons que ce type de décomposition sera encore employé pour inverser 
les matrices et pour calculer les valeurs propres. 

La matrice À étant d'ordre n il en sera de même des matrices D et G, et l'écriture de À = DG 
conduit à écrire n? équations à (n?+n) inconnues. Nous sommes donc libre de choisir n inconnues 
à notre convenance : choisissons d'écrire les éléments de la diagonale principale de D égaux à 
l'unité. Les deux matrices D et G s'écrivent : 


1 0 0 0 

doi 1 0 0 

day da2 das 0 

dni dn2 dns 1 

911 912 913 :-: Jin 

0 g2 923 ... Yn 
_|0 O 933 ... sn 
G= 0 0 O  ... Jan 
0 0 0 Inn 
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Par identification, on trouve : 


1. la première ligne de G : 

11 — Qu 912 = Q12 -.. Jin = Gin 
2. la deuxième ligne de D, soit l'élément d21 qui s’obtient à partir de : 

an = daigu 
3. la deuxième ligne de G s'obtient au moyen des relations : 
a22 = du1gi2 +922 a23 = d21913 + 923 N An = ain + Jon 
4. la troisième ligne de D est donnée par : 
ası = d31911 as2 = d31912 + d32922 
5. la troisième ligne de G est obtenue au moyen de : 
a33 = d31913 + d32923 e azn = d319in + d3292n + J3n 


6. On poursuit en calculant alternativement la ligne suivante de D puis la même ligne de G 
jusqu’à la ligne n. 


On trouvera sur le Web (*) le programme triangle.c qui réalise une telle décomposition. 
2.3. Application à la résolution du système linéaire AX = B 
Nous pouvons donc écrire : 
AX = DGX =B 


il est possible de poser Z = GX, et donc d’obtenir aisément le vecteur Z dont les composantes 
sont données par le système d'équations DZ = B qui se décompose de la manière suivante : 


Yi = di dayı +yz = d2 dzıyı + d32y2 + Y3 = ds ...  dniYi + dn2Y2 +++ Yn = dn- 


Cet ensemble d'équations permet de déterminer les composantes de Z. Connaissant Z, il est 
aisé de calculer le vecteur X au moyen de l'équation Z = GX dont les composantes donnent : 
InnTn = Zn 
Jn-inTn + fn-in-1Tn-1 = 2n-1 


Jin£n + Jin-1Zn-1 + °°" + g12£2 + 91222 + J111 = 21. 


Donc à partir des récurrences ainsi définies nous sommes en mesure de résoudre un système 
linéaire. 
Remarque : Si la matrice est singulière, elle ne peut pas être décomposée en un produit de 
deux matrices triangulaires. 


On trouvera sur le Web (*) le programme trianlin.c mettant en œuvre cet algorithme. 
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2.4. Calcul d'un déterminant 


Après la présentation des algorithmes de résolution de systèmes linéaires, il résulte que le 
déterminant À d’une matrice carrée W est égal au produit des pivots multiplié par (—1}?, 
p étant le nombre de permutations de lignes effectuées au cours du calcul. Il est aussi égal au 
produit des éléments de la diagonale principale de la matrice triangulaire G. 


Remarque à propos de la méthode des pivots — On rencontre souvent l’idée selon laquelle 
la méthode des pivots peut être améliorée si, à chaque fois que l’on traite une ligne, on amène 
celle qui possède le plus grand pivot en valeur absolue. 

Cette façon de voir est complètement erronée pour la raison qui suit. Le calcul propage 
les erreurs cumulées sur chacun des pivots obtenus avec une ultime soustraction (susceptible 
de fournir une redoutable erreur relative). Le produit des pivots m étant constant et égal au 
déterminant À, le fait d’utiliser les grands pivots au début du calcul impose les petits pivots 
à la fin... Donc le déterminant, le système linéaire etc. verront croître les erreurs au fur et à 
mesure que se déroule le calcul, et cela d’une manière plus rapide que la simple proportionnalité 
au nombre des opérations arithmétiques réalisées. 

e Que faut-il faire alors? - Comme nous avons : A = [ [p-o Pk, l'erreur relative ÂA sur A 
est donnée par l'expression : 


n 


= LD 


k=0 


Opi 


Pk 


Pk 


eei 


k=0 


car les erreurs absolues ôp; sont grosso modo les mêmes. On peut encore écrire : 


8A e| < 
$ < A 2. lx. 


Le membre de gauche sera majoré par la somme des modules des pivots (à une constante 
multiplicative près). C’est lorsque les pivots sont égaux en module que la somme des modules 
est minimum puisque le produit des pivots doit être constant. 

En conséquence, la seule méthode raisonnable consiste à choisir le pivot qui est toujours le plus 
proche en module de JA]. Pour cela il faut obtenir une première valeur de A et procéder par 
itérations jusqu’à ce que deux valeurs consécutives du déterminant soient égales à la précision 
de la machine. 


2.5. A est une matrice de Vandermonde (1735-1796) 


Nous rencontrerons à nouveau ce type de problème à propos du polynôme d’interpolation de 
Lagrange ; on cherche à calculer les coefficients du polynôme de degré n qui passe par les (n +1) 
points d’un échantillon (@;,8;) avec j = 0,1,2,... ,n. La seule restriction consiste à supposer que 
les abscisses œ; sont toutes différentes les unes des autres. 

Le polynôme s’écrit sous la forme : 


P(x) = 5 art”. 
k=O 
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Nous obtenons ainsi le système linéaire suivant : 


Ï 42 oè 
1 œg aĝ a ag| lao Bo 
1 ol a? a a?| la Bi 
1 al oœ o azl- laz| = |62 
L ai a3 n 
1 a, an a, an| An On 


On se propose de résoudre ce système d’ordre n + 1 au moyen des déterminants de Vander- 
monde dont nous rappelons la propriété essentielle suivante : 


T E: n 
1 ag aĝ a ag 
1 ai a où al nfn 

1 a où n| — JV = A+) 
1 a} do o} a3 =]] J [io - a = À (a) 
A PILES MES i=0 |j>i 

1 2 3 n 
1 a, a, a a? 


Ici, l’ordre du déterminant de Vandermonde est n +1, d’où la notation A+!) (a). On exprime 
alors ao sous la forme du rapport classique de deux déterminants que l’on note : 


ao = -Au 
0 A+) (a) 
1 2 3 
Bo ag ag à ag 
1 2 3 
Bi ai af aji af 
avec Aag = |62 a a? où a3 
1 2 3 n 
Bn Qn Qn Qn An 


Divisons la première ligne de Aag par a}, puis la deuxième ligne par al et ainsi de suite, nous 
obtenons : 


Bo 2 
— 1 aj ao aÿ ap” 
a 
LA i 
— 1 al af a a i 
n A 
= 2 = 
Aa = i akj 1 al a a az! 
k=0 a2 
Bn £ 
— 1 al a o ... an!l 
An 


En développant ce déterminant par rapport à la première colonne, on voit que Aap est une 
combinaison linéaire de déterminants de Vandermonde d'ordre n notés : 


n n 
A?) = [T |I- a), 
k=0 | j>k 
kži | jži 


MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ 


soit encore : 


n 


N- (i ax) ; Doy agla) 


j=0 


À présent, on sait calculer ao ; on peut donc reporter sa valeur dans les équations de départ 
et faire disparaître la première ligne qui devient inutile puisque nous connaissons effectivement 


ao. Le calcul de a1,a2,... ,an se ramène à la résolution du système linéaire d’ordre n suivant : 
1 n—1l 
1 ai ..… a ai Bi — ao 
Le n 
1 a} vue az! a2 1 |82 — ap 
- = — avec C = IL: 
Re C l 
i=1 
1 al an An Bn — ao 


L'opération qui consiste à calculer une valeur a; (d’abord ao) puis à éliminer une ligne s'appelle 
défiation. À présent, nous sommes en mesure de calculer a} par le même procédé, toutefois, 
l’ordre de la matrice a baissé d’une unité, ap ayant disparu. En poursuivant les opérations, on 
calcule de proche en proche toutes les valeurs az. 


Cas où un des ai est nul — L’algorithme semble tomber en défaut si l’un des a; est nul. Il 
wen est rien. En effet, si la valeur a; est nulle, c’est la seule par hypothèse, donc on peut 
permuter la ligne j avec la ligne zéro sans que rien ne soit changé. Dans ces conditions, on 
connaît immédiatement la valeur ao = ĝo puisque la première ligne de la matrice ne contient 
que des zéros à l’exception du premier élément qui vaut un. Après déflation, nous revenons au 
problème précédemment traité. 

Nous donnons sur le Web (*) le programme vdmonde.c qui réalise ces opérations. Remarquons 
que ce programme utilise très peu de place mémoire : seuls les vecteurs y sont utilisés. 


2.6. À est une matrice de Hilbert (1862-1943) 


Une matrice de Hilbert À d’ordre n est une matrice symétrique dont les éléments azk sont donnés 
par l'expression suivante : 


ak avec l, k =0,1,2,...,n— 1. 


— l+k+1 

C’est une matrice bien connue pour son mauvais conditionnement. Pour s’en convaincre, il 
suffit de choisir le vecteur inconnu X et de calculer le second membre B. Prenons pour compo- 
santes du vecteur X d'ordre n les entiers successifs de 1 à n, soit to = 1, £1 = 2,...,%n1 =N. 
Le produit AX donne le second membre B. À partir de A et de B proposons-nous de déterminer 
X pour n = 5,10,15 et 20. Rapidement les résultats deviennent aberrants. C’est la raison pour 
laquelle on dit que la matrice À est mal conditionnée. Il est facile de calculer chaque fois le 
déterminant de la matrice À qui tend rapidement vers zéro avec l’ordre n. Pour n = 15, on 
trouve un déterminant de l’ordre de 10778... on comprend ainsi où se situent les pertes de 
signification. 
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On donne sur le Web®) le programme hilbert.c qui fournit les résultats de ces calculs. 


2.7. À est une matrice creuse 


On considère à présent un système linéaire AX = D dont la matrice À d’ordre N est constituée 
de trois bandes tridiagonales de sous-matrices carrées d’ordre n et notées Ak, Bp et Ck comme 
le montre la figure ci-dessous : 


B QC X1 D: 

As B> C Xə Dz 

À3 B3 C3 X3 — D; 
C1 X m1 Dm-1 

Am Bm Xm Dm 


le vecteur inconnu X et le vecteur second membre D étant partitionnés en sous-vecteurs de 
n composantes. On dit que la matrice A est creuse. Comme l'inverse d'une matrice creuse est 
une matrice pleine, on va mettre en œuvre une méthode spécifique qui n’est rien d’autre que 
la généralisation de la méthode exposée lors de l'étude des fonctions-spline (cf. chapitre 6). Au 
moyen d'opérations linéaires, le but est de faire disparaître les matrices A4 et de remplacer les 
matrices By par la matrice unitéd’ordre n notée Ix; on obtient alors la disposition suivante : 


L Wi Xi Gi 
L Wa Xa Go 
L W X3 _| G3 
Wm-1 Xm-1 Gm-1 
Tos Xm Gm 


Gı = Bi ' D: 


On calcule alors facilement Xm = Gm, puis en remontant on calcule par récurrence : 


Xk = Gk — WkXk+41 pour k=m-1,m—2,...1. 
* http://www.edpsciences.com/guilpin/ 
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3. Inversion d’une matrice carrée d'ordre n 


3.1. Méthode des pivots 


Soit une matrice carrée À d’ordre n que l’on suppose inversible. Le problème consiste à 
déterminer la matrice A1 telle que : 


AAT1= ATtA=I 


expression dans laquelle 7 est la matrice unité d’ordre n. 
Dans un premier temps, portons notre attention sur le système linéaire suivant : 


AX =E; 


où E; est le vecteur colonne unité qui possède la valeur zéro partout sauf sur la ligne à où la 
valeur est un. Nous pouvons écrire : 


X = AE; = Aït 


autrement dit, la résolution de ce système linéaire fournit la ¿° colonne de la matrice inverse 
ATE 

Nous savons résoudre ces n systèmes linéaires, mais il est plus habile de les résoudre 
simultanément car, sinon, nous effectuerions inutilement n fois la transformation de la matrice. 
Au lieu d’accoler à la matrice À le vecteur second membre, il suffit de lui accoler la matrice unité 
(les n vecteurs unité), puis de procéder à la même transformation que celle qui a été proposée 
pour résoudre un système linéaire, à la différence près que l’on traitera n seconds membres au 
lieu d’un seul. 

Sur le Web), il est proposé le programme matinv.c qui inverse une matrice carrée. 


3.2. Méthode par triangularisation 


L’inverse d’une matrice triangulaire supérieure est une matrice triangulaire supérieure, et lin- 
verse d’une matrice triangulaire inférieure est une matrice triangulaire inférieure. Commençons 
par traiter la matrice D dont la matrice inverse est A. Nous avons : 


AD =] 
qui fournit les équations : 
Ôkkdkk = 1 
et, pour l >k 


Ôi k+idi+1,k + ÔL k+2di42,k +++ + udik 
dkk 


Ok = 
soit encore : 
dk = — (Ôl k+1di+1,k + Ôl k+2di+2,k + ++: + Ôudik)ókk. 
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Après avoir calculé les d;x, on calcule ligne à ligne à partir de la dernière, et dans chaque 
ligne les éléments colonne par colonne à partir de la dernière colonne. 

On procède d’une façon tout à fait identique pour la matrice G dont la matrice inverse est T. 
Nous écrivons : 


TG=I 
qui fournit les équations : 
YkkJkk = 1 


et, pour l < k 


Yugik + Yl l+1Jl+1,k + VNui+29142,8 + °° 
Jkk 


Yik = 
soit encore : 


Yik = —(Yugik F YJ, k + Y+29i+2,k + °° )Ykk- 


Après avoir calculé les 4, on calcule ligne à ligne à partir de la première, et dans chaque 
ligne les éléments colonne par colonne à partir de la première colonne. 

Sur le Web C) on trouvera le programme trianinv.c qui inverse une matrice carrée au moyen 
de cette procédure. 


Remarque : Quelle que soit la méthode utilisée, il est prudent d’effectuer toujours les vérifica- 
tions usuelles. Il sera bien venu de procéder ou bien à la multiplication de À et de AT? qui doit 
redonner — aux erreurs près — la matrice unité, ou bien à l’inversion de la matrice inverse qui 
doit fournir la matrice de départ — toujours aux erreurs près. 


4. Calcul des valeurs propres 


Il s’agit de calculer les valeurs propres de matrices carrées d’ordre n à coefficients réels ; 
cependant, les méthodes proposées peuvent s'appliquer aux matrices à éléments complexes. 
Nous allons examiner diverses méthodes qui donnent des résultats plus ou moins intéressants 
selon la taille de la matrice À ou son conditionnement. Le problème est donc la résolution de 
l'équation caractéristique ou séculaire : 


AX = 1X 
où X s'appelle vecteur propre et À valeur propre. 


4.1. La méthode de Le Verrier (1811-1877) 


L'’équation caractéristique d’une matrice d'ordre n est un polynôme de degré n, et les racines de 
ce polynôme sont les valeurs propres de la matrice. Si nous pouvons obtenir les coefficients du 
polynôme caractéristique, la méthode de Bairstow nous permettra d’en calculer les racines. La 
solution repose sur les relations de Newton qui établissent une expression entre les coefficients 
d’un polynôme et les 57 (somme des racines du polynôme élevées à la puissance q). 
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Relations de Newton — Soit P,(r) un polynôme de degré n que nous écrivons : 
P,(t) = aox” + az”? + aa 2 +... Las, avec a #0. 


Désignons par p; les racines réelles ou complexes de ce polynôme qui se met alors sous la forme : 
n 
Pa (£) = ao [lé — pi). 
i=1 


À présent, nous allons dériver (par rapport à x) de deux façons différentes P,(x) et identifier 
les résultats obtenus. Nous obtenons : 
1 
Pj, (2) = Pale) X 
T — Pi 


i=1 


1 


z—pi 


za aa aa 


d’où nous déduisons : 


expression dans laquelle nous développons soit : 


` pi = somme des racines, 


X p? = somme des carrés des racines, 
on peut donc poser : 


ST — >" avec q = 0,1,2,...( en remarquant que S° = n). 
i=1 
Nous obtenons alors : 
A l OEE E SP 
5 = SE ++ HeH 
T + x i 


t—pi T 
i Pi 


i= 
Par ailleurs la dérivation directe nous donne : 
Pix) = aons”? + a(n — 1) 2 + azs”? +. ani 


ce qui permet d'écrire l'identité : 


done + a(n = 1)£"? + az2"? +--+ an1 


1 S Pp L SP 
= (ao2" taa”! t agt"? t.e Han) + + + 


x? r3 zP 
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Il reste à identifier les coefficients des termes de même degré en x, ce qui nous fournit les 
relations de Newton : 


aos! + 41 = 0 
ags? + aS! + 2a2 = 0 
aos? + a S? + az S! + 343 = 0 


a08” + a +... +a, 19! + nan = 0 
pour p > n, nous obtenons : 
ag SP + a SP +... Han SPH H an SP = 0, 


Le problème qu’il reste à résoudre consiste à calculer effectivement les valeurs ST qui, ici, seront 
les sommes des valeurs propres à la puissance q, pour q = 1,2,...,n. Revenons à l'équation aux 
valeurs propres : 


AX = ÀX 
et multiplions successivement (n — 1) fois à gauche les deux membres de cette équation par À : 


AX = AX = XAX = XX 


et ainsi de suite, on obtient d’une façon générale : 
AIX = XX avec q =1,2,3,...,n... 


Nous savons que la trace de la matrice À est égale à la somme de ses valeurs propres; de 
même, la trace de la matrice A7 est égale à la somme des valeurs propres de À élevées à la 
puissance q. Par conséquent, la trace de la matrice A1 est égale à S%. (On rappelle que la trace 
d’une matrice est la somme de ses éléments sur la diagonale principale.) Il suffit de calculer la 
trace de À puis de multiplier À par À soit B — AA et de calculer la trace de B. Ensuite, on 
multipliera B par À puis on calculera la trace de B, et ainsi de suite jusqu’à obtenir la valeur 
de S”. 

On trouvera sur le Web (*) le programme leverier.c qui calcule les valeurs propres (réelles 
ou complexes) de matrices réelles par la méthode de Le Verrier. 


4.2. Méthode de Rutishauser (1918-1970) 


Nous décomposons la matrice A dont on cherche les valeurs propres en un produit de deux 
matrices triangulaires l’une, Dı, triangulaire inférieure et l’autre, G1, triangulaire supérieure 
telles que À = D: G. 

On calcule la matrice B, qui est le produit de G et D; dans l’ordre, soit : 


Bı = Gi Dı. 
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On décompose B, en un produit de deux matrices triangulaires D, et Go telles que : 
B = D2G2, 


puis on calcule le produit de Gə et D2 que l’on appelle B2, on poursuit ce type de décomposition 
et l’on obtient en définitive les résultats suivants : 


Bo =A= DiG: 
Bı = G Dı = DG 
Bə = G2Də = D3G3 


Lorsque la décomposition triangulaire est possible, on montre que la matrice B, a les mêmes 
valeurs propres que la matrice À. 

En général, B, tend vers une matrice triangulaire et les valeurs propres se situent alors sur 
la diagonale. De plus si celles-ci sont réelles et distinctes, elles apparaissent dans l’ordre des 
modules décroissants en descendant le long de la diagonale principale. 

On trouvera sur le Web (*) le programme rutishau.c qui calcule les valeurs propres selon la 
méthode de Rutishauser. 

Sans entrer dans les détails liés aux valeurs propres multiples, aux valeurs propres complexes, 
etc., il est utile de mentionner que cette méthode, dans sa version accélérée, sert de fondement 
à l'établissement de la méthode de Givens. 

On trouvera sur le Web (*) le programme rutishac.c qui calcule les valeurs propres selon la 
méthode accélérée de Rutishauser. 


4.3. Méthode de Givens (1912- ) 


La méthode de Givens consiste à réduire la matrice À en une forme quasi triangulaire au moyen 
d’une suite de transformations unitaires, puis d'appliquer une des méthodes de Rutishauser à 
convergence quadratique. Nous allons exposer la suite de ces opérations. 

Désignons par À la matrice dont on cherche les valeurs propres et par a;; ses éléments. Pour 
réaliser la transformation unitaire notée U, (UT )*U = I, on pose : 


Ap—1,q l 


p 
r= s = ———, 
Ap—1,p VI + pp* V1 + pp* 


l’astérisque désignant la valeur conjuguée et UT la transposée de U. 
Les colonnes p et q sont transformées selon les expressions : 


bp—1,p = Ap-1,p V1 + Pp* bp-1,9 = 0 


Dep =T Qkp + S* ūką 


bka = —Sükp tT akg avec k =p,...,n. 
*http://www.edpsciences.com/guilpin/ 


82 


5. ÉLÉMENTS DE CALCUL MATRICIEL 


Ensuite, les quatre valeurs bgg, bpp, bqp €t bpq Sont remplacées par les quantités : 


— — _eo* 
Cpp = T bpp + 8 bap Cga = 5" bpa + T baq 


— — a* 
Cpa = T bpa + 8 bag Cap = Cpg: 
Les lignes p et q se transforment par des expressions analogues : 
Chi = T bpl + Sba Cat = —S" bp +r bg avec l= 1,2,..., n. 


Toutes ces expressions viennent se substituer aux éléments correspondants dans la matrice A. 

Dans le cas où @p—1,p = 0, alors on prend bp—1,p = @p—1,q puis r = 0 et s = 1, ce qui correspond 
à une rotation de 7/2. 

Cette méthode nous conduit donc à obtenir une matrice quasi triangulaire inférieure. Une telle 
matrice se décompose aisément selon la méthode de Rutishauser en une matrice triangulaire 
inférieure D et une matrice triangulaire supérieure G. 

Pour des raisons de commodité d'écriture, on note la matrice À au moyen des a;; pour la partie 
triangulaire et œ pour la diagonale située immédiatement au-dessus de la diagonale principale. 
On écrit donc : 


@11 2 0 0 
a21 a22 Q3 0 
a31 a32 a33 0 
A=| ax Q42 a43 0 
Gn—1,1 An—-1,2 An-1,3 An 
Gn1 An2 An3 -- Ann 
bi 0 0 0 
bo: b22 0 0 
bai b32 b33 0 
D =! ba b42 bas 0 
bn—1,1 bn-12 n-13 :--. 0 
bai bn bn3 e. bnn 
1 BP 0 0 
0 1 & 0 
0 0 1 0 
G=10 0 0 0 
0 0 0 Bn 
0 0 0 1 


Les b;; et les 8; sont donnés par les expressions : 


Bar 


g—1,g—1 
bpa = apq — Pa bp,q-1 pour p= 1,..., n, 


a 
q pour g=2,...,n, 


lesquelles viennent remplacer les valeurs correspondantes dans le tableau des a;j. 
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Le calcul du produit C = G - D conduit aux nouvelles expressions : 


Cp1 = dpi + p+1 bp+1,1 pour p= 1,...,n— 1, 


Cn1 = bni 


puis en notant par Yp les éléments de C au-dessus de la diagonale principale : 


Ya = Pa baq 
Cpa = bpa + Bp+1 bp+l,q pour p=q,... n — 1, 
Cng = bng- 


À la fin de ce premier tour de calcul, on note Q la dernière valeur figurant sur la diagonale 


de la matrice C. On retranche Q de tous les éléments diagonaux et l’on réitère la procédure 
jusqu’à ce que la valeur 


k 
Àk = > cl) 
i=1 


ne soit plus modifiée par un tour d’itération supplémentaire, c’est-à-dire lorsque l’on a obtenu 
la meilleure précision avec la machine utilisée. Ax est alors une des valeurs propres recherchées. 

Une fois obtenu une valeur propre, on réduit l’ordre de la matrice de 1 unité en supprimant 
la dernière ligne et la dernière colonne. Ces opérations s'appellent déflation. Ensuite, par le 
même procédé, on passe au calcul de la valeur propre suivante. Cette méthode de Rutishauser 
concernant les matrices quasi triangulaires converge quadratiquement. (Pratiquement cela 
signifie que le nombre de chiffres significatifs exacts est multiplié par un coefficient proche de 
deux à chaque tour d’itération.) 

Rappelons que les calculs s'effectuent en arithmétique complexe dans le cas général. 

On trouvera sur le Web (*} le programme givens.c qui calcule les valeurs propres réelles des 
matrices réelles. 


4.4. Méthode de Danilevski (1937) 


Cette méthode consiste à transformer la matrice À ou plutôt le déterminant caractéristique en sa 
forme canonique de Frobenius au moyen de transformations linéaires qui laissent le déterminant 
inchangé. Une fois la forme canonique obtenue, on écrit directement l’équation caractéristique 
dont on cherche ensuite les racines au moyen d’une méthode appropriée, la méthode de Bairstow 
par exemple. 

Écrivons l'équation caractéristique A(À) associée à la matrice A : 


Gi — À —aG2 a13 Gin-1 Gin 

a21 a22 — À a23 . An-1 An 
A(à) = a31 a32 433 — À A Agn—1 An 

Qni An2 An3 Gnn-1 Ann — À 


* http://www.edpsciences.com/guilpin/ 
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On désire obtenir la forme suivante : 


bi m À —b2 —b3 —Un-1 —bn 

1 —X 0 0 0 
B(A\)=1 0 1 À 0 0 

0 0 0 1 — À 


On passe du déterminant A(À) au déterminant B(A) au moyen de combinaisons linéaires soit 
de lignes, soit de colonnes (cf. la méthode des pivots concernant la résolution des systèmes 
linéaires). La transformation s’effectue de bas en haut, à savoir : 


1. On divise l’avant-dernière colonne par an,n—ı pour amener 1 à la place de an,n-1 (les pivots 
de la transformation se situent sur la première sous-diagonale). Pour conserver le coefficient 
1 devant À, on est amené à multiplier l’avant-dernière ligne par an n-1. On désigne par alg 
les valeurs obtenues sur la dernière ligne. 

2. Ensuite, on combine linéairement les colonnes pour que le déterminant ait sa dernière ligne 
selon la forme canonique : 


0 0 sit 0 1 — À. 


Pour cela on multiple l’avant dernière colonne par ala et lon retranche le résultat de la 
colonne q, avec q = 0,1,2,...,n — 2,n. Cette opération a amené des termes en À sur l'avant 
dernière ligne avec les coefficients aiis g=1,2,...,n—2,n, qu'il faut à présent éliminer sauf 
sur la diagonale principale. 

3. En retranchant terme à terme la première ligne multipliée par dns on fait disparaître À du 
premier élément a,-_1,1 de l’avant-dernière ligne. On opère de la même façon avec la deuxième 
ligne multipliée par a,2 pour éliminer le terme en À de a»_1,2 et ainsi de suite pour obtenir 
lavant dernière ligne privée de termes en À excepté l’élément diagonal. 


On passe ensuite au pivot suivant qui est l’élément an—1,n—2, on divise alors la ligne (n — 1) 
par cet élément et on multiplie la colonne (n — 1) par ce même élément, puis on poursuit les 
calculs de la même manière que pour la ligne n. 


Cas où un pivot est nul — Si un pivot est nul la méthode tombe en défaut. Supposons qu’il 
s'agisse du pivot ag,k-1 alors on regarde dans la ligne k si un des termes compris entre les 
colonnes 1 et k — 2 est différent de zéro. Supposons qu’il en soit ainsi et que le terme axq soit 
différent de zéro. On ajoute alors les éléments de la colonne q à ceux de la colonne k — 1. Cette 
opération fait apparaître un terme en À sur la ligne q et la colonne k — 1. On le fait disparaître 
en retranchant à la ligne q la ligne q + 1. 

Le cas où il n’y a que des zéros sur la ligne k dont le pivot est nul montre que les calculs ne 
peuvent pas se poursuivre de cette manière, mais le déterminant est alors le produit de deux 
déterminants dont l’un a la forme voulue de Frobenius et l’autre la forme ordinaire. À ce dernier 
déterminant, on peut alors faire subir à nouveau le traitement de Danilevski. Dans le cas le plus 
défavorable, on aura un produit de déterminants chacun écrit sous la forme ordinaire. 

On trouvera sur le Web (*) le programme danilev.c qui calcule les valeurs propres réelles des 
matrices réelles. 


*http://www.edpsciences.com/guilpin/ 
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4.5. La méthode de Krylov (1879-1955) 


Elle repose sur le théorème de Cayley-Hamilton (toute matrice À d’ordre n est solution de son 
équation caractéristique), soit : 


n 
An + Say A0, 
g=1 
les ax étant les coefficients du polynôme caractéristique. On multiplie les deux membres de cette 
expression par un vecteur arbitraire d'ordre n que l’on appelle X, on obtient : 


n 
Y ag AIX = —A"X. 
q=1 


On commence par calculer Bo = X, Bı = ABo,..., Bk41 = AB%,..., et enfin Bn = AB,-_1. 
Les vecteurs Bẹ sont les colonnes de la matrice du système linéaire à résoudre pour obtenir les 
coefficients ax du polynôme caractéristique. Les dispositions du calcul sont les suivantes : 


bin-1 Din-2 biın-3 --. bu biol la bin 
bon-1 bzn-2 bam-3 ... ba bf jaz|_ _ [bən 
bnn-1 bnn—2 bnn 3 --. bni bno An bnn 


Le vecteur X est arbitraire, et on le choisit très souvent avec toutes ses composantes égales à 
lunité. Reste à déterminer ao = (—1)”. 

Cette méthode n’exigeant que peu de calculs est fort attrayante, malheureusement elle conduit 
à un système mal conditionné lorsque n atteint et dépasse quelques unités de l’ordre de 8 à 10. 

On donne sur le Web (*) le programme krylov.c qui réalise cet algorithme. 


4.6. Cas des matrices symétriques 


Les matrices symétriques sont hermitiennes et par conséquent ne possèdent que des valeurs 
propres réelles. Quand on calcule les zéros d’un polynôme caractéristique dont les coefficients 
sont mal conditionnés on court le risque de voir apparaître presque sûrement des racines 
complexes dont on se passerait bien. La méthode de Givens-Rutishauser permet de contourner 
cette difficulté. On trouvera dans les exercices un problème mettant en œuvre la méthode de 
Jacobi adaptée au cas des matrices symétriques et qui donne de très bons résultats, on fournit 
également le programme (cf. annexe H, problème 5.8). 


4.7. Retour sur les matrices de Hilbert 


Les valeurs propres des matrices de Hilbert sont réelles puisque la matrice est symétrique, 
cependant, leur calcul est une source de difficultés puisque le déterminant de la matrice d'ordre 
n tend vers zéro quand n tend vers l'infini. En effet, le produit des valeurs propres est égal au 
déterminant de la matrice. Par ailleurs, la somme des valeurs propres est égale à la trace de la 
matrice. Toutes les conditions sont réunies pour avoir des valeurs propres très grandes et à coup 
sûr d’autres très petites. 


*http://www.edpsciences.com/guilpin/ 
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Avant de développer le thème de l’interpolation, il est sans doute utile de préciser la nature du 
problème proposé, car, très souvent, les opérations d’interpolation et les opérations de lissage 
sont confondues dans l'esprit de bien des utilisateurs. Que ce soient des résultats expérimentaux 
ou que ce soient des tables, la plupart des fonctions, au sens large, ne nous sont données que pour 
un ensemble discret de points qui constitue un échantillon. Toutes les fonctions transcendantes 
dites spéciales ont fait l’objet de tabulation pour des valeurs de la variable en progression 
arithmétique. Bien entendu il est rare que la valeur de la fonction figure dans la table pour la 
valeur dont on a réellement besoin et l’on est obligé de se livrer à une opération d’interpolation 
-- voire d’extrapolation — pour obtenir le résultat désiré. 

Un problème identique apparaît lorsque l’on veut traiter numériquement un ensemble de 
résultats expérimentaux quand bien même le procédé utilisé pour les recueillir eut été réalisé 
par voie analogique. 

Bref, c’est l’éternel problème : on ne peut avoir accès qu’à un nombre fini de valeurs. Le 
problème posé par l’interpolation ne doit pas être dissocié à proprement parler du problème 
de l’extrapolation (dans la mesure où il s’agit d’effectuer une extrapolation qui a effectivement 
un sens). Quel que soit le problème auquel on s’attache, on dispose toujours au départ d’un 
ensemble fini d’ordonnées correspondant à un ensemble fini d’abscisses, ces deux ensembles 
appartenant nécessairement à des intervalles finis. Appelons 7 l'intervalle de définition des 
abscisses. Ces ensembles de valeurs constituent un échantillon de la fonction f(x) à laquelle 
nous nous intéressons. 

Quand nous cherchons à connaître f(x) pour une quelconque valeur appartenant à I, hormis 
pour les points de l'échantillon, nous dirons que nous effectuons une interpolation. En revanche, 
quand nous cherchons à obtenir f(x) pour une valeur de x située à l’extérieur de J, nous dirons 
que nous réalisons une extrapolation. Ces deux problèmes s’abordent de la même façon, mais 
c’est le calcul d’erreur qui va introduire une différence entre les deux. Au passage, nous noterons 
que l’extrapolation dans les voisinages immédiats des bornes de 7 fournit d’excellents résultats. 

Pour ce qui concerne les opérations de lissage, il faut dire qu’elles ont un autre but : il s’agit 
avant tout d'effectuer un filtrage sur un ensemble de données entachées d’erreur. On cherche alors 
à rendre compte d’une allure globale des données expérimentales au moyen de fonctions plus 
ou moins arbitraires dont on ajustera les paramètres — le plus souvent en utilisant la méthode 
des moindres carrés -— mais, ce qui importera en priorité, sera l'élimination de ces erreurs qui 
constituent un bruit de fond. Nous aurons amplement l’occasion d'approfondir ce problème, 
et nous examinerons un certain nombre de méthodes qui réalisent ces opérations de filtrage 
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éventuellement après qu’auront été abordés quelques éléments de statistique, la méthode des 
moindres carrés et la transformée de Fourier. 


1. De la légitimité de l’interpolation 


En règle générale, la fonction f(x) connue au moyen d’un échantillon de points est continue sur 
l'intervalle 7 que nous venons de définir. Il s'ensuit que sur cet intervalle elle peut être approchée 
uniformément par un polynôme et cela en vertu du théorème de Weierstrass (1815-1897). Du 
reste il n’y a pas de difficulté à généraliser cette proposition au cas où l’approximation est réalisée 
par un système quelconque de fonctions pourvu qu’il soit complet. 

Les systèmes complets usuels sont : le système des puissances (les polynômes orthogonaux 
usuels), le système des sinus et des cosinus, les fonctions de Bessel, les fonctions du cylindre 
parabolique etc. 

L'idée d’interpoler par un polynôme est bien antérieure à la publication du théorème de 
Weierstrass (1815-1897) et elle a été exploitée par de nombreux savants mais c’est le nom de 
Lagrange qui est resté attaché à cette technique. Comme elle présente un grand intérêt théorique, 
nous allons nous y attarder quelque peu. 


2. Le polynôme de Lagrange (1736-1813) 


Le problème consiste à obtenir le polynôme de degré n qui passe par les (n + 1) points de 
l'échantillon. Les abscisses ao, 4&1, . . - an appartiennent à l'intervalle T qui est le plus petit possible, 
et la fonction réelle f(x) prend les valeurs bo, b1,...b, correspondant aux abscisses respectives. 

Aucune hypothèse n’est faite sur les échantillons à cette réserve près toutefois que, pour une 
valeur donnée de az, il ne peut correspondre qu’une seule valeur bp. Cela implique que tous les 
ax sont différents. Si tel n’était pas le cas, il conviendrait d’effectuer une partition (ou plusieurs) 
pour réaliser cette condition, et l’on associerait à chacune des partitions obtenues un polynôme 
de Lagrange unique. Supposons que pour la valeur ax il y ait deux valeurs yı et y2, cela veut 
dire que l’on découpe l'intervalle 7 en deux sous-intervalles J; et Is ayant ag comme intersection 
commune. yı et yz sont attribués chacun à l'intervalle correspondant J; ou Z donné par l’allure 
de la courbe représentative. 

Tout cela précisé, nous allons établir l’existence de ce polynôme unique de degré n que nous 
désignons par P,(x) et qui s’explicite de la façon suivante : 


k=n 
P (£) = ao +t +--+ anr”) + aux" = >> OT". 
k=0 


En utilisant le fait que ce polynôme P,(x) doit prendre la valeur bp lorsque la variable x prend 
la valeur ax, nous obtenons le système linéaire suivant : 


ag ag aÿ e.. ag Q0 bo 
D c3 
Qi ai ai .. af (021 bi 
1 a a a ... aÿ|-|a@| = [|b 
l an 6 Sa an] [Qn bn 
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que nous écrirons d’une manière plus concise sous la forme : 
Aa = B 
Le déterminant de la matrice À est un déterminant de Vandermonde pour lequel tous les a 


sont différents : 


j=n k=n 


det[A =][ [e aj — ak). 


j=0 k>j 


Comme conséquence immédiate il s'ensuit que la solution existe et qu’elle est unique. 

Si l’on se situe dans un contexte historique, à l’époque de Lagrange (1736-1813), le calcul des 
coefficients ne pouvait pas s’effectuer par la résolution d’un système linéaire dès que l’ordre de 
la matrice dépassait quelques unités, et Lagrange proposa une technique qui a permis de réaliser 
directement l’interpolation sans calculer explicitement les coefficients du polynôme. C’est cette 
méthode que nous exposons maintenant. 

Considérons un polynôme de degré (n + 1) appelé Qn+1(£) et défini par la relation : 


N 


QnH(x) = [Lt g aj). 


j=0 


À présent, décomposons le rapport P (£)/Qn+1(x) en éléments simples, opération possible 
puisque, par hypothèse, tous les a; sont différents ; nous pouvons écrire : 


Pal) — E À; 
0 eu 
d’où l'expression prise par le polynôme P,(x) : 


n 


Pa (x) = Qni (2) S 5) > Fr o 


i=0 


Comme il est possible d'écrire que : 


ne II -0) 


(x — ai) cr, 
JF 
nous obtenons alors : 
N n 
PA(z) = $4 À [e — aj) 
i=0 j=0 
Ji 


Maintenant il nous faut chercher à expliciter les À; en tenant compte du fait que le polynôme 
doit passer par les points d’échantillonnage. Cela donne les relations suivantes : 


Palak) = bk = >A Š [Hu = aj). 


JA 
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Comme l'indice j prend toutes les valeurs de 0 à n, excepté la valeur à, les produits seront 
toujours tous nuls sauf celui pour lequel nous aurons à = k. On en déduit l’expression suivante : 


= À} : Hie m aj). 
ai 
Nous tirons alors la valeur de Ap que nous reportons dans l'expression de P,(x) : 


=V II] ea : (6.1) 
i=0 s i 


s= + 
si 


z 


© 


P, (x) est donc le polynôme passant par tous les points de l’échantillonnage, et nous en avons 
obtenu deux expressions. Il convient d’ajouter que ce polynôme peut être utilisé aussi bien pour 
réaliser une interpolation qu’une extrapolation. 

Comme par expérience on sait que l’extrapolation est une opération peu précise loin du 
domaine T, il est nécessaire dès à présent de se faire une opinion sérieuse sur l’erreur commise 
en remplaçant une fonction f(x) échantillonnée par le polynôme de P,(x), et c’est l'expression 
due à Lagrange qui va nous permettre de résoudre le problème. 


3. Evaluation de l'erreur 
Supposons que f(x), remplacée par P,(x), soit (n + 1) fois dérivable sur l'intervalle T, et 
considérons la fonction auxiliaire ®(u) définie comme suit : 


n 


IC — ai) 
Du) = f(u) — Palu) — (f(x) — Pn (2) Fc 


(x = ai) 


i 


Cette fonction ®¢(u) qui apparaîtra sans doute un peu artificielle va nous permettre d'exprimer 
aisément la valeur absolue de l'erreur E(x) commise en effectuant le remplacement de f(x) par 
P, (x) : 


E(x) = f(x) - Pa(x), 


ce qui, par parenthèses, explique la structure de (u). Pour parvenir à notre fin, dérivons (n+1) 
fois la fonction (u) par rapport à u, ce qui donne : 


BOD u) = Ju) ~ [f(e) - Pa] DE | 
IE — ai) 


i=0 


Remarquons que la fonction ®(u) s’annule pour toutes les valeurs u = a; mais aussi pour 
la valeur u = x. L'application successive du théorème de Rolle (1652-1719) à (u) permet 
de voir que la dérivée OH) (u) s’annule pour une valeur u = £ appartenant au plus petit 
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intervalle contenant x et les a; (dans le cas de l’extrapolation x n’appartient pas à l’intervalle 7 
précédemment défini). Nous obtenons alors l’expression suivante : 


BDE) = DE — (a) 0, 
IL — a;i) 
i=0 
de là nous tirons l'expression de l’erreur E(x) : 
: FE 
E(x) = He M) 


Comme chaque fois en pareil cas, on procède à la majoration de SAM (x ) dans l'intervalle 
adéquat. Rappelons que cet intervalle sera plus grand que 7 s’il s’agit d’une extrapolation, 
c’est-à-dire que x n'appartient pas à l’intervalle T. Désignons par M,41 la limite supérieure de 
fi) (x) dans l'intervalle concerné, l'expression de l’erreur devient : 


Ie- &)|. 


On voit immédiatement que l'erreur est nulle sur les points d’échantillonnage et qu’elle est 
très petite dans le voisinage de ces points. De plus il est important de noter que l’expression de 
E(x) varie en fonction de x et que, de plus, elle dépend des points ag. On peut alors se poser la 
question de savoir comment choisir les ag pour que l'erreur E(x) soit minimum. 


Man 
(n+1)! 


i 


E(x) 


4. Comment minimiser E(x) 


La seule façon possible de réaliser opération est de rendre minimum l'expression te — a;i) 
qui n’est rien d’autre qu’un polynôme de degré (n + 1). Nous montrerons au chapitre 9 le 
théorème suivant : parmi tous les polynômes à coefficient principal réduit de degré (n + 1), 
c’est le polynôme de Tchebycheff (1821-1894) qui s’écarte le moins de l’axe des x sur l'intervalle 
(—1, +1). Ce polynôme a pour expression : 


cos|(n + 1)Arcos(z)|. 


Tn+1(2) = on 


Les zéros de ce polynôme sont donnés par : 
(n + 1)Arcos(zx) = 5 CA +1), 


soit : 


a(2k +1) 


——— k=0,1,2,... 
2n+0 avec 0,1,2,...,n 


Zk = COS 


En réalité, on ne travaille pas sur l'intervalle (—1, +1), mais sur l'intervalle 7 dont la borne 
inférieure est a et la borne supérieure b. Le changement de variable : 
2% —-a—b 

b—a 


D 
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permet de passer de l’intervalle (—1,+1) à l'intervalle (a,b). On en déduit que le polynôme de 
Tchebycheff de degré (n + 1) à coefficient principal réduit défini sur (a,b) a pour forme : 


b— a}"t1 27 —a—b 
( ) 
g2n+1 Tai b—a , 


ce changement de variable donne également les zéros de ce polynôme : 


a+b b-a  xr(2k+1) 
TR = — + z Cos 2m +1) avec k —0,1,2,...,n. (6.2) 


Pour minimiser l'erreur, il faut choisir les ak identiques aux x} qui sont donnés par l’expres- 
sion (6.2). 


Remarque : Il est à noter que l'erreur est donc minimum pour un partage de l'intervalle 7 selon 
les zk, et cela est indépendant de la fonction à interpoler. Cette règle demeure dans le cas où la 
fonction f(x) est connue empiriquement, et la meilleure façon d’obtenir des valeurs exploitables 
avec la plus petite erreur repose sur le choix des xx donnés par l'expression (6.2). On insiste donc 
sur la généralité de ce théorème qui ne préjuge en rien de la nature de la fonction à interpoler 
si ce n’est l'hypothèse traditionnelle de continuité. 


5. Autre disposition pratique du calcul du polynôme de Lagrange 


Il faut bien reconnaître que le calcul effectif du polynôme de Lagrange pour un ensemble 
de valeurs de z demande un travail assez laborieux, aussi préfère-t-on employer une autre 
expression qui conduit à des calculs plus économiques et surtout qui permettra d'établir un 
certain nombre d’autres formes réputées canoniques. Pour ce faire, on se propose d’adopter la 
disposition suivante : 


Ph(t) = Bo + Bi1(x — ao) + B2(x — ao)(x — a1) 
++ Br — ao)(£ — a1)... (£ — an-ı), (6.3) 
dont il faut déterminer les Bx. D’abord on a P,(ao) = bo = Bo, ensuite on peut poser : 


Qn-1(x) = Sih = Bı + B(x = a) + Ba(x = a)(x zei az) 


+ + Bn(z — a1)(x — a2)...(x — an-1), 


ce qui permet d'écrire 


Considérons à présent : 


S Qu-a(x) — Bı 
a T — Q1 


Qn-2(x) 


= B + B3(x — a2) + Bar — a2)(x — as) 
+- + Balz — a2)(x — a3)...(x — an_1), 
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expression dans laquelle on fait z = a2, ce qui donne : 


Qn-2(a2) = ere 2e Bə, 


soit encore : 

B, = bo = bo = Bı (a2 — ap) 

3 = i 
(a2 — ao) (a2 — a1) 


On poursuit de la même façon le calcul pour obtenir tous les Bẹ. 


Récapitulation de la conduite du calcul 


Sur le tableau ci-dessous on a représenté la suite des opérations qui permet de calculer tous les 
B,;. 


aobo = Bo 
bı — bo 
1 
abı = Qn-1 = Bı 
di — do 
3 2 
bo m bo 2 Qn—1 n—1 2 
a202 — n- — An-2 — B2 
a2 — QQ a&2 — 1 
3 T 3 2 
b3 — bo 3 Ce nı 3 An-2 7 An-2 Bu 
a3b3 — ni — An-2 — An-3 — Bs 
a3 — ao Q3 — Q1 a3 — Q2 
n n—1 n n—1l 
bn bo n An-1 7 In-1 n An-2— In—2 n 
anbn = ni a An—-2 = An-3 — Bn 
An — Q0 An — Q1 An — Q2 


6. Cas où les abscisses sont en progression arithmétique 


Désignons par h la raison de la progression ; nous avons donc la suite des abscisses donnée par : 
ag, a1 = ao + h, a2 = ag +2h,...,an = ao + nh. 

C’est un cas particulier, certes, mais il est très répandu, et à ce titre il mérite d’être examiné 
car il conduit à des expressions très connues et très simples d'emploi. Pour aborder cette étude 
il nous faut au préalable définir les opérateurs de différence. 

On appelle différence première d’ordre k la valeur A bp donnée par l'expression : 


Abe = bk41 — bk = flao + (k + 1)h] = f(ao + kh). 
Ensuite, on définit les différences deuxièmes d’ordre k : 
Abp = Atbps1 — Abe 


et ainsi de suite pour les différences troisièmes, quatrièmes, etc. D’une façon générale on définira 
les différences p° d’ordre k au moyen de la relation : 


APbr = APT Ibp — AP Ib avec p <n. 


Remarque : Si les valeurs (a;,b;) sont données par un polynôme de degré m (f(x) = PA(x)), 
il va de soi que les différences d’ordre k supérieures à m sont nulles et que toutes les différences 
m° sont égales. 
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La signification des différences est simple, ce sont les expressions numériques approchées des 
valeurs de la dérivée première, de la dérivée deuxième, etc. au point (ax, bg). 

Ici la valeur ao est la valeur initiale de la suite, mais on peut très bien écrire les formules 
d’approximation en choisissant pour valeur initiale ag un point d'intérêt particulier dans le 
tableau des données ; dans ce cas, les abscisses précédant ao sont notées par des indices négatifs : 


â-k = A) — kh. 


Cette dernière remarque conduit à l'écriture de différentes formes du polynôme de Lagrange 
qui offrent de grands avantages lorsque l’on ne désire employer qu’une partie restreinte du tableau 
initial des données. Ces différentes formes portent le nom du savant qui s’est attaché à une de 
ces études, on étudiera donc les polynômes ascendant et descendant de Newton, les polynômes 
de Stirling et de Bessel. 

Dans le cas où l’on utilise toutes les données du tableau, soit (n + 1) points, tous les 
polynômes que nous venons d'évoquer donnent alors les mêmes résultats puisque ce ne sont 
que des expressions différentes du même polynôme de Lagrange. Toutefois nous verrons une 
petite nuance concernant les polynômes de Stirling et de Bessel qui sont respectivement l’un 
pair l’autre impair, mais cela ne restreint pas la généralité de notre propos. 


T. Les polynômes d'interpolation de Newton (1643-1727) 


Reprenons l'équation (6.3) dans laquelle nous tenons compte du fait que les abscisses sont en 
progression arithmétique : 


P;,(x) = No t Ni(x ao) } M(x ao)(x € h) 
++ N,(x — ao)... [£ — ao — (n — 1)h]. (6.4) 


Pour obtenir les valeurs des (n — 1) coefficients Ng, il suffit de donner à x la suite des valeurs 


ao + kh avec k = 0,1,2,...,n. À l’aide des différences premières, deuxièmes etc., le tableau 
précédent se transforme ainsi : 

æ b Alb Ab Ab Ab 

ao bo 


On obtient alors : 
Ph (ao) = bo = No 
Pa (ao + h) =b =No + Nih 
Pa(ao + 2h) = bz = No + 2Nih + 2!N2h? 


Pa(ao + nh) =bn = No +nNih + n(n —1)Noh? + n(n —1)(n — 2)N3h? +... + n! Ngh”. 
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À présent, nous allons exprimer de proche en proche les coefficients Np au moyen des 
opérateurs de différence définis au paragraphe précédent. On obtient donc : 


No = bo 
bi —bo Albo 
N- = = 
1 h h 
N= (b2 — b1) — (bı — bo) Ab 
cu 21h? ~ h2 
_ Ab 
E KIRE 
B A”bo 
a nihe 


Pour des raisons de concision d'écriture il est commode de poser : 


. g — ao 
R 
Ainsi l'expression devient : 
z(z—1 z({z — 1})...|z-(n-1 
Pa (z) = bo + zA!bo + ADA ++ CE PU (6.5) 
Cette formule s'appelle polynôme de Newton descendant. Elle est utilisée pour effectuer des 
interpolations en tête de tableau (ce qui signifie que l’on réalise l’interpolation avec le début du 
tableau et non pas avec tout le tableau). 
Pour obtenir les interpolations en queue de tableau — disons avec le dernier quart des 
données — il suffit d'écrire le polynôme de Newton en considérant un pas négatif, c'est-à-dire 
en changeant de signe la raison de la progression arithmétique. L'expression (6.4) devient : 


P,(x) = Mo + Mi(x = ao) + M(x aa ao)(z — ao + h) 
+- + M,(x — ao)... [£ — ao + (n — 1)h]. (6.6) 


Comme précédemment, on donnera à x les valeurs ao — kh avec k = 0,1,2,...n, mais, pour 
éviter toute confusion, on affectera un indice aux valeurs correspondantes des ordonnées avec 
un signe négatif, soit b-p. On obtient alors : 


Ph (ao) =b —=M 

P; (ao = h) = b_; = Mo San Mıh 

P (ao — 2h) =b-2 = Mo — 2Mih + 21M3h? 

Palao = qh) =b = Mo = qMık + g(q m 1)M2h? = g(q = 1)(q = 2)M3h° 
Lee + (1) Mah" 

Palao — nh)=b_, = Mo -nMih+n(n —1)M2h? — n(n — 1)(n — 2)M3h’ 
++ (Ln! Mah". 
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À partir de ces expressions, on tire la suite des Mg données en fonction des opérateurs de 
différence : 


Mo TE bo 
bo—-b Ab: 
M == — 
à h h 
A?b_» 
M = -ipa 
_ Ab & 
E kihk 
z A”b_ n 
nO nihe 


Toujours en posant z = (x—ao)/h, nous obtenons la forme canonique du polynôme de Newton 
ascendant : 
z(z+1) 


sh Si 
Pale) = bo + Atb 1 + 26 a, +. Etat 


A"b_ (6.7) 


En résumé, les deux polynômes de Newton permettent d'obtenir des expressions adaptées à 
l’interpolation des panneaux de tête et de queue des tableaux lorsque l’on n'utilise qu’une partie 
des données. Il reste donc la partie centrale que l’on interpole par les polynômes de Stirling et 
de Bessel. 


8. Le polynôme d'interpolation de Stirling (1692-1770) 


On obtient ce polynôme en faisant jouer un rôle symétrique à l’ensemble des données par rapport 
à ag, pour cela on écrit le polynôme (6.4) sous la forme suivante : 


Paz) = So + S1(x — ao) + Sax — ao + R}(x — ao) + S3(x — ao + R)(x — ao)(x — ao — h) 
++ Sog(x — ao + qh) ... [£ — ao — (q — 1)h] + Szq41 (£ — ao + qh)... (£ — ao — qh). (6.8) 


Pour obtenir les valeurs de S%, il suffit de donner à x la suite des valeurs ao, ao = h, ao + h, 
ao — 2h, etc., ce qui permet d'écrire : 


(ao) =b =% 

(ao = h) =x bı = So = Sih 

(ao + h) =b = So + Sih — 282R? 

(ao = 2h) = b_) = So — 2Sih + 25S,h? ms 31S3R3 

Pa(ao — qh) = b-q = So — q$1h + q(q — 1)S2h° — qalq — 1) (g + 1)Ssh° 
reg DS 1477 


Palao + qh) =bn = So + qS1h — q(q — 1)S2h° + qalq + 1)(q — 2)S3h + +. + (2q)!Sah?1. 
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Tout comme précédemment, on tire les valeurs des coefficients Sy; exprimés en fonction des 
opérateurs de différence : 


So = bo 
Atb: 
1= Re 
_ Ab 
27 21h? 
L A2, 
#7 (g)n2 
A2a+1p g 
S2g+1 De 


(2q + 1)!h?2+1 
En utilisant le même changement de variable que celui déjà utilisé à propos des polynômes 
de Newton, nous obtenons une forme plus concise : 


2 p 
A E ETN EE aei E Di. a 
| z(2? a lee nu Z 2 e EN (6.9) 


À présent, écrivons le même polynôme (6.8) en fonction d’abscisses données pour une raison 
négative : 
Pa(£) = Ro + Rı(x — ao) + R2(x — ao)(£ — ao — h) 
+ R3(x — ao + h)(x — ao)(£ — ag — h) 
+- + Rale — ao + (q — 1)h] ... (£ — ao — qh) 
+ Roqg+1(& — ao + qh)... (£ — ao — qh) (6.10) 


Sans entrer dans le détail puisque les opérations ont été explicitées à plusieurs reprises, on 
obtient les coefficients Rẹ au moyen des expressions : 


Ro = bo 
Albo 
1 h 
Ab; 
R = -i 
Abg 
2a (2g)h2 
A29+1 
Rog+1 = 


(2q + hm 


En procédant au changement de variable en z on peut écrire : 


-1 ed 
P;(2) = bo + zAt!bo + A ia + a Date 


2 E 2 2—4 
PAU THEME a (an 
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Par définition le polynôme de Stirling est la demi-somme des expressions données par (6.9) 
et (6.10), lequel s'écrit simplement : 


Albo + Ab un A1) (Abi+ Ab) (2-1), 
PA (2) = bo Tr Z 9 T Jl A bi T 3 2 + 4! A b2 
l z(z? = 1)(22 = 4) (A5b_2 + A5b_3) an (6 12) 
i 5! 2 | 


Il convient de remarquer que l’on arrête l'expression du polynôme de Stirling au terme A°1%b_, 
et non au terme précédent : 
(APS 1h 5 + A72- D.) 
2 3 


tout simplement parce que si l’on connaît A?24-1b_,,, et A% 1b_;, on connaît A%b_,. On en 
déduit que le polynôme de Stirling est toujours un polynôme de degré pair et qu’il faut connaître 
(2k + 1) points pour un polynôme de degré 2k. 

Le polynôme de Stirling est utilisé pour effectuer les interpolations situées dans le deuxième 
quart du tableau lorsque, évidemment, on utilise une fraction seulement du tableau. 

Dans les mêmes conditions, il nous reste à s'intéresser au troisième quart du tableau, ce sera 
chose faite après l’étude du polynôme de Bessel. 


9. Le polynôme d'interpolation de Bessel (1784-1846) 


Pour obtenir le polynôme de Bessel il suffit d'effectuer la demi-somme du polynôme (6.9) et du 
polynôme (6.11). Au préalable on réalise dans la relation (6.9) le changement de variable z en 
(z — 1) qui correspond à un décalage des indices d’une unité, nous pouvons écrire : 


— 1] 
PA(z) = bi + (z SF. 1)A1bo + Er Day 


(z= 1)(z = 2) A3 . 4(2* -= 1)(z2-2) 
3! i 4! 


J 
jj 


Afb +--- (6.13) 


le polynôme d’interpolation prend alors la forme : 


K 2 2 Ps = 

P, (2) = nth + (z — 1/2)Atbo + ee DEC ta torse De 1/2) 3 
. z(2? — 1)(z — 2) (Afb_ı + Afb_2) 
| 4! 2 


Ajoutons que nous devons arrêter le polynôme de Bessel à l’ordre (2k + 1), c’est en effet un 
polynôme impair qui demande (2k + 2) points pour sa définition. 


10. Erreurs commises en utilisant les polynômes d’interpolation 
Il suffit de réaménager la formule établie lors de l'étude du polynôme de Lagrange pour chacun 


des cas envisagés ici, c’est-à-dire l'expression de E(x). Nous obtenons alors les expressions 
suivantes : 


100 


6. L’INTERPOLATION 


10.1. Le polynôme de Newton ascendant 


hett 


10.2. Le polynôme de Newton descendant 
n+l 
|En(z}| < a EE (6.15) 
10.3. Le polynôme de Stirling (polynôme pair) 
R2n+1 
|En (2)| < |2(22 — 1)... (2 - n?)| Gn Di Men (6.16) 
10.4. Le polynôme de Bessel (polynôme impair) 
h2r+2 
LEan+2(2)1 < [227 - 1)... (2? —n)(2? -n —1)] Qn +2 ne (6.17) 


Dans ces quatre expressions M, conserve la même définition que celle qui a été explicitée au 
cours du paragraphe 3 de ce chapitre. 


11. Programmes déterminant les polynômes d’'interpolation 


Nous avons donné sur le Web) les programmes lagpoly.c, ascend.c et descend.c qui 
permettent d'obtenir les formes de quelques polynômes rencontrés dans ce chapitre, soient le 
polynôme de Lagrange et les deux polynômes de Newton qui sont les formes les plus usitées 
(cf. la méthode d’Adams concernant l'intégration des équations différentielles). 


12. Interpolation par les fonctions-spline 


Replaçons-nous dans les conditions générales du début du chapitre du moins pour ce qui concerne 
les données. L’interpolation dans un tableau de (n + 1) points réalisée au moyen du polynôme 
de Lagrange de degré n ou d’une des variantes due à Newton, Stirling ou Bessel, peut souvent 
conduire à des calculs assez longs et dont l'intérêt n’est pas toujours vraiment immédiat. Alors, 
on pourra préférer de réaliser les interpolations, par exemple, au moyen des fonctions-spline qui 
ne sont rien d’autre que n polynômes de degré q représentant les données expérimentales dans 
chacun des n intervalles. Un polynôme et un seul représente la fonction dans un intervalle formé 
par deux abscisses consécutives (ax, ax41). 

Chaque polynôme ayant (q + 1) coefficients, on doit au total calculer n(q + 1) termes. Pour 
réaliser cette opération on impose les conditions suivantes : 


*http://www.edpsciences.com/guilpin/ 
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a. Chaque polynôme QË(x) réalisant l’interpolation entre les points az et @ķ+1 passe par ces 
deux points. 

b. Les dérivées premières, deuxièmes et ainsi de suite jusqu’à l’ordre (q — 1) des polynômes 
QE (x) et Q$(x) se raccordent au point ap, c’est-à-dire qu’elles sont égales chacune à 
chacune. 

c. Comme nous avons imposé [2n+(n—1}}(q—1) conditions, il manque encore (q— 1) conditions 
pour fermer le système. Alors, on impose arbitrairement que les dérivées d’ordre le plus élevé 
concernant les deux polynômes extrêmes Q;(x) et Qg (x) s’annulent respectivement au point 
ao et au point an. Si q est impair, les (q—2) dernières dérivées de Q} (x) et Q7 (x) s’annuleront 
respectivement au point ag et au point an. Si q est pair le problème devient dyssymétrique 
et l’on choisira les (q — 2)/2 dernières dérivées pour un polynôme et g/2 pour l’autre. 


Ces généralités étant énoncées, nous allons fixer notre attention sur les fonctions-spline du 
troisième degré qui constituent de loin celles qui sont le plus fréquemment employées. 


13. Les fonctions-spline du troisième degré 


Il n’y a dans ce cas que deux conditions à ajouter pour que le système des équations linéaires 
soit fermé. Nous avons : 


Qu(x) = ako + am + Akr’ + Ox3T° 
Qr(ar-1) = bk-1 
Qk(ar) = bk 
Qrlak) = Qk (ak) 


klak) = Qk (ar) 
plus les deux conditions arbitraires : 
Qi (ao) = 0 Qnlân) = 0. 


En toute rigueur, il nous faut résoudre un système linéaire de 4n équations à 4n inconnues. 
Comme la matrice des coefficients est une matrice-bande, nous allons développer une méthode 
spécifique pour obtenir les paramètres inconnus. Il s’agit en fait de réduire le plus possible le 
nombre d’inconnues en exploitant convenablement les conditions que nous venons d’expliciter. 
Pour cela posons : 


hk = ax — ax 
Ma =Qÿ(as) pour g=1,2,...(n—1). 


Nous allons exprimer les polynômes en fonction des M, qui sont pour l'instant des inconnues. 
Ces quantités vont être déterminées par un système linéaire que nous allons définir. Comme 
nous avons : 


(x) = Zak + 6az3T 


V (ak) = Mr = 2ax2 + 6ax3ar 


K(ak-1) = Q%-1(ar-1) = My_1 2072 + 6arsar_1 
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on en déduit que : 


6 k — Mi 
A3 = 
ük — Ak-1 
et 
My — Mk- 
2axo = Mp — E og 
ak — ûk—1 
puis 
My — Mk- My — Mk- 
Ur) = My k k dan k k-i y 


hr hr : 
cette dernière expression se transforme en : 
U(x) = [Mrak — Mrar-1 — Mrar + Mk-1ap + Mpz — Mr-12] /hx 
d’où nous tirons 
p(z) = [M (2 — ak1) — Mr-1(2 — ax)] /hr. 


Maintenant, nous allons intégrer successivement deux fois cette expression puis déterminer les 
deux constantes d'intégration au moyen des deux conditions : 


Qu(ax-1) =bk-1 et  Qx(ax) = br- 
Nous pouvons alors écrire : 


(x — ax_1)° 


3 
hkQk(z) = Mk 6 Mr |e ar) | + Kzx+L, 
d’où 
h2 
K = bp — bx-1 — (Mr — My_1) a 
et 
h? h?r 
L = hkbg — M — (bk — bx-1)ax + (Mk — Mi-1) ak 
Nous obtenons alors : 
h2 h? h3 
Kz + L= bpr — bkit — Meg? + Mie + hkbk — ME 
h? h? 
— akbk + bk—10k + Mk g — Mk-1 rUs 


En regroupant les termes et en tenant compte du fait que hy est donné par l'expression hk = 
ak — ak—1, ON obtient : 


2 


h?r h2 
Kzr+ L= C = Mie) (x — ax-1) + (ue Mk-ı 6 ) (ax — x); 
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d'où nous pouvons écrire : 


3 


(x — akı) M;i (x — ap)’ 


hkQk(x) = Mr 5 à 


hr 
+ (oi: My: ) (ou z); 


Par cette succession de transformations nous avons réduit le nombre d’inconnues du système 
linéaire, et ce sont les Mp qui deviennent les nouvelles inconnues au lieu des coefficients ax0, @k1, 
ax2 et «xs. Pour calculer effectivement les Mp, nous devons utiliser le fait que les polynômes 
Qr(x) et Qx+1(x) doivent avoir leurs dérivées premières qui se raccordent au point ap. Nous 
obtenons ainsi : 


bei Ok _ bebri, 
hk+1 hk 


Puisque les polynômes Qo(x) et Qı(x) sont déterminés par Mo = M, = 0, on obtient donc 
un système de (n-— 1) inconnues en faisant varier k de 1 à (n — 1). 

À présent, il reste à résoudre un système linéaire dont le premier membre dépend d’une matrice 
tridiagonale. 


14. Résolution d’un système linéaire dépendant d'une matrice tridiagonale 


Comme la plupart des éléments de la matrice sont nuls, il est préférable d'utiliser une méthode 
adéquate pour traiter ce système linéaire. En effet l’utilisation d’un programme général serait mal 
venue car la plus grande partie du temps de calcul serait consacrée à l’obtention de résultats 
nuls. Donc nous allons présenter une méthode adaptée au problème, méthode d'autant plus 
intéressante qu’elle est généralisable au cas d’une matrice pentadiagonale par exemple. 

D’une façon tout à fait formelle, écrivons un système linéaire qui dépend d’une matrice 
tridiagonale : 


Mai M2 0 0 0 0 T1 C1 
M21 M22 M23 0 0 0 To C2 
0 M32 M33 M34 0 0 T3 __ | C3 
0 0 0 Mn-in-2 Mainzi Mn—in Tn—1 Cn—1 
0 0 0 0 Mn,n—1 Ma,n Tn Cn 


système que l’on peut écrire sous la forme condensée : 
P 


On traitera plus avantageusement le tableau T à n lignes et (n + 1) colonnes obtenu en 
juxtaposant à la matrice M le vecteur C. 
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Une transformation linéaire tout à fait analogue à celle utilisée dans la méthode des pivots 
permet de passer du tableau T au tableau T* par suppression d’une diagonale de la matrice M, 
tous les éléments de la diagonale principale prenant la valeur 1 (cf. chapitre 5). Pour parvenir à 
notre fin, nous allons diviser la première ligne du tableau T par l'élément diagonal m11. Ensuite, 
il suffit de multiplier la première ligne par mə et de retrancher le résultat de la deuxième ligne. 
On divise alors cette deuxième ligne par l’élément situé sur la diagonale. On pourrait penser qu’il 
vaut mieux commencer par effectuer la division par le pivot avant d'effectuer la combinaison 
linéaire qui élimine m21, mais dans ce dernier cas, on réalise une opération en trop qui est 
Ma1/Mo2. En effet, il est inutile de diviser m3, par m3, après la réalisation de la combinaison 
linéaire car m3, est nul. Cette remarque fait gagner (n—1) opérations ce qui n’est pas négligeable 
lors de procédures répétitives où le temps d'exécution peut devenir important. 

En poursuivant de ligne en ligne la même façon d’opérer, on aboutira nécessairement au 
tableau T* qui aura la forme suivante : 


1 pro 0 0 di 
0 1 P23 0 do 
0 0 1 p34 ds 


La dernière ligne donne directement la valeur de la dernière inconnue. La ligne (n — 1) permet 
d'obtenir alors l’inconnue (n — 1) par substitution et ainsi de suite en remontant jusqu’à la 
première ligne du tableau. En considérant le problème de résolution d’un système linéaire sous 
cet angle particulier, on aboutit à une économie considérable de mémoire et de temps de calcul. 

Sur le Web (*), on trouvera le programme lispline.c qui réalise l’interpolation par des 
fonctions-spline du troisième degré. 


15. Une application simple des polynômes d'interpolation 


L'intégration formelle d’un polynôme est une des rares opérations que l’on sache réaliser 
rigoureusement. Il n’y a pas de difficulté particulière donc à utiliser les polynômes d’interpolation 
pour réaliser les opérations de quadrature. 

En particulier, si l’on utilise les fonctions-spline du troisième degré,on aboutira à une valeur 
numérique dont la précision est analogue à celle donnée par la méthode de Simpson (1710-1761) 
puisque, dans les deux cas, il s’agit d’interpoler une fonction par une parabole cubique. 

Nous fournissons sur le Web (*) le sous-programme aire.h qui assure cette intégration. Nous 
donnons les étapes du calcul de l’expression qui est programmée. Partons de l’expression générale 
du polynôme d'ordre k : 


(x — ap-1)? MR (x — ap)’ 


P, = M, 
162) k öh Ghx 


+ (ou Mk 


* http://www .edpsciences .com/guilpin/ 
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Désignons par Sx la surface comprise entre ax_1 et ax, il vient : 


ak : r E 
a | P(x) dr = [ut 1) My CE z! 


24hk 24h 
ak1 
h?r \ (ak — x}? h? N (x — ak1)? in 
bk—-1ı — Mk- H [bk — Mp E 
( d REG ) 2hy i F6 2hk 
Ak—1 
Le développement de cette dernière expression conduit à la formule simple : 
h? h 
Sk = S (Mk + Mk-1) + F (bk + bk1) 


là on tire : 


s= S Sk, 
k=1 


expression dans laquelle S est l'intégrale totale. Dans le cas fréquent où les abscisses sont en 
progression arithmétique, nous pouvons poser h = hk quel que soit l'indice k, on arrive alors à 
une expression encore plus simple de § : 


= bo + bn hè (© Mi + M 
sn (Ên- tt) (ur) 


16. L’algorithme d’interpolation d’Aitken (1932) 


Il s’agit d’une procédure — encore appelée algorithme de Neville-Aïtken — destinée au calcul 
d’un polynôme pour une valeur particulière alors que le dit polynôme est connu par (n + 1) 
points (£k, Yk) avec k = 0,1,2,...,n. C’est une méthode directe qui permet d’obtenir donc une 
valeur unique du polynôme, en ce sens elle est analogue au polynôme de Lagrange. 

Dans ce paragraphe, on désigne par Pp...q le polynôme de degré (q — p — 1) qui passe par les 
points (tp, Yp) -- - (Lq, Ya) et par Pp,... (x), le polynôme de degré (p — q — 2) qui passe par les 
points (£p, Yp) - - (Tkg Ya) à l’exception du point (£r, Yr). 

Avant même de rentrer dans le cœur du sujet, il est possible d’ores et déjà de remarquer que 
l’ordre des points ne joue aucun rôle quant à la nature des polynômes. 


16.1. Relation de récurrence entre les polynômes P 
Entre les polynômes Pp... Po. (n).….g €t Pp,..,(o),...q il existe la relation de récurrence 
suivante : 
Lo — € F, E CT) sie 
(Er — To) Ph,.a = E p Ur (6.18) 


où, pour plus de clarté, nous précisons que le second membre est un déterminant. 
La démonstration de cette relation repose sur le fait que, pour une valeur x, différente de £r 
et To, On à : 


Pp...a(tr) =P epy — P h — Yv- 


6. L’INTERPOLATION 


La relation (6.18) peut donc s’écrire : 


(tr To )Yv 7 (Cr Ty)Yv (£o Tuyo ma (x cu Lo)Yv- 


Pour le cas où £y = £y, nous pouvons écrire : 


(Tr ES Lo )Yr = — (£o = DA 


et dans le cas où x, = £o, nous obtenons encore l'identité des deux membres de (6.18) : 


(Tr — To Yo = — (Tr — Zo )Us: 


On en conclut que légalité (6.18) est une relation qui permet de calculer le polynôme Pp,...,q 
de degré (q — p — 1) à partir des deux polynômes de degré (q — p — 1) qui sont P,.. (x),...q €t 
P 


Pi... (0), 


16.2. Calcul numérique de y, 


En faisant usage de la relation (6.18), nous allons calculer le polynôme Po 1,...n pour la valeur 
£u en formant une suite convenable de polynômes intermédiaires Pp,... 9 et Pp,... (x).….g: À Ce 


propos nous étudierons deux méthodes, l’une due à Aitken l’autre due à Neville laquelle n’est 
qu’une modification de la méthode d’Aitken. 


a — Méthode d’Aitken — Pour résoudre le problème des polynômes intermédiaires, Aitken a 
proposé la disposition suivante : 


TO — Lu Yo 
to~ zı 1 Zn Y Po 
Ti — T2 To T2 Lo Zu Y2 Pos Por 
Ta — T3 Tı— T3 Lo—Ta La Tu Ya Pos Pois Fours 


Ly1 — Ty ve Ti Lun LG Lu Lu Lu Yv Pm Poin Porin Poi.n 


À partir de la disposition des yp et des (£a — xg) on va calculer les polynômes Poi, Poz, - - - , Pon 
à l’aide de la relation : 


1 
Po; = ;— (x; r i = 1,2,3,...n. 
0j (to map LA Tu)Yj (x; u)Yol avec J eon 
Ensuite on calculera la colonne suivante dans le tableau, c’est-à-dire Poi2, Po13, -.., Poin au 
moyen de l'expression : 
1 ; 
Puj = > [(z1 — tu )Poj — (£j —2,)Pn] avec j =1,2,3,...n. 
(£o — z4) 


On procédera ainsi de suite jusqu’à l'obtention de l'élément Po1...n qui constitue, en définitive, 
la valeur recherchée yp. 


Remarque 1 : Pour obtenir une précision optimum, on peut se poser la question de savoir 
quelle doit être la distribution initiale des points car nous sommes libre de numéroter les points 
comme bon nous semble. 

Dans le cas d’une extrapolation, on adoptera l’ordre des points allant du plus près de £m au 
plus éloigné. 
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S'il s’agit d’une interpolation, on choisira une distribution initiale qui correspond à un 
encadrement du point £m de telle sorte que l’on réalisera la disposition suivante : 


ue L Eok Lo... < T2 < To < Lm < T1 < T3 <... < Tkl- 


Autrement dit, comme le montre le calcul concernant l’interpolation, ce sont les points les 
plus proches voisins de £m qui jouent un rôle prépondérant, donc il convient tout simplement 
de faire jouer un rôle prioritaire à ces points dans les calculs. 


Remarque 2 : Il n’est donc pas nécessaire d’utiliser les points très éloignés de £m dans le calcul 
de Ym car ils n’auront que très peu d'influence sur le résultat. 

Du reste, si au cours du calcul, on rencontre deux termes Poi... et Por...k+1 qui sont chacun 
le dernier élément de deux lignes consécutives du tableau proposé par Aitken et qui sont égaux 
« à la précision de la machine », il n’est pas utile de poursuivre les calculs jusqu’à l’obtention 
de Por...n- 


b — Méthode de Neville — Neville a proposé une autre disposition du tableau d’Aiïtken qui 
est reportée ci-dessous : 


To — Tu Yo 


To — T1 Tı- tu Yi Pı 

To — T2 T1 — T2 To — Zu 2 P2 Poaz 

To — T3 T1 — T3 To — T3 T3 Zn Yy P23 P3 Poz 
Lo— Tn +. Tn-2 En Æn-1 -Tn En Tu Yn Pn-in Porn Porn 


16.3. Exemple numérique d'interpolation par la méthode d'Aitken 


On se propose d'effectuer une interpolation dans la table suivante : 


z y 
0,0 1,000 0 
0,5 0,9385 
1,0 0,7652 
1,5 0,5118 
2,0 0,2239 
25  —0,0484 
3,0  —0,2601 
3,5  —0,3801 


On reconnaîtra là un extrait de la table de la fonction de Bessel de première espèce Jo(x). On 
désire effectuer l’interpolation pour la valeur x = 1,70. La table donne y = 0, 3980. On trouvera 
sur le Web (*) le programme p_aitken.c réalisant la procédure d’Aiïtken, lequel fournit pour la 
valeur d’interpolation 0,397 97. 


*http://wuw.edpsciences.com/guilpin/ 
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17. Approximation par une combinaison linéaire de fonctions 


Les polynômes de degré n constituent une première méthode pour approcher une fonction f(x) 
lorsque nous en connaissons (n + 1) points. Cependant, dans bien des situations concrètes, 
l’échantillonnage à traiter est obtenu à partir de données expérimentales entachées d'erreur. Il 
devient illusoire de vouloir trouver un polynôme passant par chacun des points obtenus, car il 
n’y a en général aucun intérêt à vouloir rendre compte de l’aspect aléatoire des phénomènes 
étudiés... Dans ce cas précis, on dispose de considérations à caractère théorique qui permettent 
de pressentir une fonction ou une combinaison linéaire de fonctions qui passe au voisinage de tous 
les points d’échantillonnage. Bien entendu, il convient de définir ce qu’on entend par voisinage, 
mais au préalable, il faut distinguer les types d’approximation que nous venons d'évoquer : 
soit nous désirons connaître les coefficients figurant dans une certaine fonction, plus ou moins 
compliquée, censée rendre compte d’une expérience, soit nous cherchons à déterminer les valeurs 
des coefficients d’une forme linéaire destinée à «lisser » les points expérimentaux. 

Le premier problème est généralement non linéaire et pose un certain nombre des difficultés 
techniques sur le plan du calcul numérique. Le second se résout tout naturellement au moyen du 
calcul matriciel que nous avons évoqué au début de ce chapitre. C’est cet aspect qui va retenir 
notre attention, et nous nous proposons de «passer le plus près possible de tous les points » au 
moyen d’une combinaison linéaire de fonctions ®,(x) dont le nombre (m + 1) est inférieur (ou 
égal) au nombre (n + 1) de points. 

A priori, il y a bien des moyens de « passer le plus près possible de tous les points », et il 
est aisé de subodorer qu'il existe une infinité de solutions au sens mathématique du terme. À 
ce stade, il est nécessaire de préciser ses désirs, et c’est la méthode des moindres carrés qui se 
présente en excellente position pour résoudre le problème. Désignons par : 


O(x) = Ÿ_a;$;(x) 
3=0 


notre combinaison linéaire. La méthode des moindres carrés consiste à rendre minimum la forme 
quadratique : 


2 


n 
k=0 


DID odlar) -br 
j=0 


On dit aussi que l’on rend la somme des carrés des résidus la plus petite possible, car la 
différence €k = Der a;®;(ax) — bk s'appelle résidu d'observation. La dérivation par rapport 
aux coefficients an qui rend minimum la forme quadratique donne immédiatement une forme 
linéaire qui détermine précisément les coefficients &;. 

Nous cherchons donc à rendre minimum la quantité : 


2 


E =X e=) |J aðila) -br ]} , 
j=0 


k=0 \j=0 


pour cela on écrit que les m équations s’annulent, soit : 


dE? n = 
Ja 0-2 Ex) Ÿ_a;d;(ax) — br ; 


k=0 j=0 
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cette dernière expression peut encore se transformer avantageusement de la façon suivante : 


n m 

0= X ajði(ar)dj (ar) — Di(ax)br avec l= 0,1,2,..., m. 
k=0 \ j=0 
Yo X Gi(ax)®;(ax) = DD Pr(ax)bx avec l= 0,1,2,...,m. 
j=0  k=0 k=0 


Nous obtenons alors un système linéaire de (m + 1) équations à (m + 1) inconnues dont la 
résolution nous fournira les coefficients @;. 


Remarque : Dans le cas où la fonction f(x) que l’on approche par la fonction @(x) est connue 
analytiquement, alors les sommes discrètes sont remplacées par des intégrales sur l'intervalle 
d’interpolation Z. Il s'ensuit que 


b 


E? = =) dz avec e(z) = f(x) — JS [a;®;(x). 
j=l 


a 


Les coefficients œj sont alors déterminés par les (m + 1) équations suivantes : 


0E S 
=D a J AOAO de — J sareen, 
=l a a 
avec l = 0,1,2,...,m. Le calcul de ces intégrales peut être éventuellement conduit numérique- 


ment dans le cas où les quadratures n’existent pas, ou pour le moins ne sont pas évidentes. 


Applications immédiates 


a — Il est aisé de rechercher un polynôme de degré strictement inférieur à n qui passe le plus 
près possible de tous les points au sens des moindres carrés. Généralement on parle de régression 
parabolique au moyen d’un polynôme de degré m ; le cas le plus connu étant le polynôme de degré 
un qui est encore appelé droite de régression en hommage au travaux de Galton (1822-1911) 
qui introduisit cette dénomination à l’occasion d’études statistiques concernant la biologie et 
l’eugénique. 


b — Système linéaire surdéterminé de (m+1) équations à (n+ 1) inconnues m étant plus grand 
ou égal à n. On écrit le système : 


X akte + ak =0, pour {=0,1,2,...,n. 
j=0 


Sans trop de difficulté on obtient le système des équations normales associé au système 
surdéterminé de (n + 1) équations à (m + 1) inconnues. Il suffit de remplacer ®;(£) par x 
dans la relation précédemment établie; on obtient alors : 


m n m 
> Qj ` Qlküjk = > Gikbk avec l= 0,1,2,... m. 
k=0 j=0 


j=0 
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Il est facile de montrer que si le système linéaire surdéterminé s’écrit au moyen de la notation 
matricielle : 


AX =b, 


A étant une matrice de n lignes et de m colonnes (avec m < n), on obtient le système des 
équations normales en effectuant l'opération suivante : 


[ATA] X = [A7] b, 


expression dans laquelle AT est la matrice transposée de la matrice A. Au passage, on notera 
que la matrice obtenue [ATA] est une forme quadratique qui est définie positive — la matrice 
est alors symétrique, ce qui est intéressant lors de la mise au point du programme correspondant. 

Sur le Web (*), on trouvera le programme surdeter .c qui réalise cet algorithme lequel fournit 
un calcul d'erreur au sens statistique du terme : il s’agit de l'écart type de chacune des inconnues. 
Ce dernier calcul est explicité au chapitre de la régression linéaire. 
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7 |Les polynômes de Legendre. 
Méthode d'intégration 
de Gauss-Legendre 


Ces polynômes sont nés d’une étude que Legendre (1752-1833) entreprit à propos de l'étude de 
l'attraction newtonienne en 1/r?. MacLaurin et Clairault (1713-1765) ont démontré que la figure 
d'équilibre d’une masse fluide en rotation dont les particules s’attirent mutuellement selon la loi 
de Newton est un ellipsoïde de révolution. MacLaurin détermina aussi la valeur de l'attraction 
exercée par un ellipsoïde homogène sur un point situé en son intérieur et sur sa surface. En 1783, 
Legendre étendit le calcul de lPattraction exercée sur un point situé à l’extérieur de l’ellipsoïde. 
La solution repose sur l’introduction d’un ellipsoïde homofocal et d’une fonction génératrice 
des fameux polynômes de Legendre. Clairaut introduisit le premier la notion de potentiel pour 
ce genre de problèmes et en 1785 Laplace montra que le potentiel obéissait à l'équation aux 
dérivées partielles qui porte aujourd’hui son nom. Les polynômes de Legendre rentrent, comme 
cas particulier, dans la classe des fonctions sphériques introduites par Laplace en 1785. 

Aujourd’hui, c’est en électrostatique que l’on se familiarise avec les polynômes de Legendre, 
mais il faut rappeler que la loi de Coulomb (1736-1806) est postérieure de deux ans à leur 
avènement. 

Nous connaissons l'intérêt qu’il y a de définir une base (complète) de fonctions orthogonales 
dans le problème d’approximation de fonctions par des combinaisons linéaires. Les polynômes de 
Legendre ont la propriété d’être orthogonaux et de constituer un système complet sur (—1, +1) 
pour les fonctions généralement continues, ainsi s’ils sont utilisés comme base de décomposition, 
les coefficients de la combinaison linéaire ne sont pas corrélés, c'est-à-dire qu'ils sont calculés une 
fois pour toutes, comme le sont les coefficients des séries de Fourier avec lesquels nous sommes 
davantage familiarisés. 

Les polynômes de Legendre ont connu rapidement une autre fortune entre les mains de Gauss 
(1777-1855) qui a utilisé leur propriété d’orthogonalité en proposant une méthode d'intégration 
numérique particulièrement précise. La technique opératoire est d’une très grande simplicité, en 
revanche, l'établissement des relations exige quelques calculs, et c’est le but de ce chapitre que 
de proposer les enchaînements mathématiques propres à éclairer la méthode. 


1. Les polynômes de Legendre 


1.1. Définition 


Les polynômes de Legendre sont des polynômes orthogonaux sur l'intervalle fondamental 
(—1, +1) qui prennent la valeur +1 pour la valeur +1 de la variable. 
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Désignons par P,(x) le polynôme de Legendre de degré n, la définition impose que : 


+1 
J A R E (71) 
21 
si Pn(x) est le polynôme de Legendre de degré m tel que m £ n. 
Si l’on remarque qu’un polynôme quelconque Q,(x) de degré p peut s’exprimer selon une com- 


binaison linéaire de polynômes de Legendre de degré égal et inférieur à p (cf. paragraphe 1.14), 
alors, pour p < n on aura également : 


+1 
Jr, dz = 0. (7.2) 


Cette dernière relation va nous permettre d'exprimer les polynômes de Legendre d’une autre 
façon en procédant à une intégration par parties. Pour cela, on posera : 

d? 
dz” 


P,(x) = Ron(x) 


où Rən(z) est un polynôme de degré 2n que nous allons déterminer. On obtient alors : 


+1 K 

f Pate) Qa) de = [ou(e) Rala) 

É n—2 n—1l 1 
Š Qola) a Ron) + + (A) QE) Rala] E 


Il convient de remarquer que le polynôme R2,(x) est défini à un polynôme de degré (n — 1) 
près ; autrement dit, il nous est possible de choisir arbitrairement n constantes définissant Ron (£), 
et l’on peut par conséquent convenir que les (n—1) premières dérivées de Ron (£) ainsi que Ron (£) 
s’annulent pour z = —1. Cela nous conduit à écrire que : 


n—1 n—2 n—1 
Role) er Ron (e) - -E Qola) a Ron (a+ + (0) Qp(e) Ron (a)] 


cependant pour quë l'intégrale (7.2) soit nulle, il faut encore que : 


da! d dd? $ d?71 
Oo) Ron (e) - 2 Qn(e) Er Ron(e) + + (I) 


Qp(&) Ron (a) = 0. 


æ=1 


Cette condition ne peut être satisfaite, quel que soit le polynôme arbitraire Q, (x), que lorsque 
Ron(x) et ses (n — 1) premières dérivées s’annulent pour z = 1. 

À présent nous avons imposé n conditions au polynôme R2, (x) ; il reste cependant défini à une 
constante multiplicative près que l’on désigne par K. On peut donc l’exprimer sous la forme : 


Ron(t) = K(z — 1)" (x +1)" = K(x° — 1)". 


Il y a plusieurs façons « canoniques » de choisir K. On peut adopter les polynômes orthonor- 
més, on peut préférer la condition P,(1) = 1, mais l’on peut tout aussi bien s'intéresser aux 
polynômes à coefficient principal réduit, c’est-à-dire ceux dont le coefficient du terme de degré 
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le plus élevé est égal à un. Cela est une affaire de circonstances et nous aurons l’occasion de 
revenir sur ce point. Quoi qu’il en soit, puisque 


Do 19e + 19", 


PA(x) = K Ja 


on peut calculer K au moyen de la formule de Leibnitz (1646-1716) qui fournit l'expression de 
la dérivée n° d’un produit (u-v) : 
d” (uv) d'u q d 1u dw nb 


Fe Guns due Ur, 


de s dz” 


il suffit de poser u = (x — 1)” et v = (x + 1)” pour obtenir la valeur de K. En effet, pour z = 1, 
tous les termes sont nuls sauf le premier et lon obtient alors : 


n 


u = Kn!2° 


Pa) =1 = Kv 2 


dr? 
ce qui donne : 


als 1 
2n! 2-4-6... (207 


et l’on obtient alors l'expression générale des polynômes de Legendre connue sous le nom de 
formule de Rodriguès (1815) : 


UE: 
7 Mn! dg” 


P, (x) (a? — 1)". (7.3) 


On déduit sans peine les premiers polynômes : 
P(x) =} 


P(x) =g 
P(x) = (3z? — 1)/2 


1.2. Relation de récurrence entre trois polynômes consécutifs 


Nous allons montrer qu’il existe une relation de récurrence entre trois polynômes consécutifs 
Pa+1(£), Palx) et Pa-ı(x). Pour cela partons de la formule de Rodriguès (1794-1851) écrite 
pour le degré (n + 1) : 


1 1 d?+1 2 
= (x 
2n+i (n +1)! dz?+t 


Ph+1(&) 1t, 


On dérive une fois l’expression (x? — 1)**!, et l’on obtient : 


1 1 q” 
Pa = —— Ft) 
HO aa CE 17) 
On peut encore écrire : 
1 1 d1 


Pay) {(x? — 1)" + 2nz? (£? 1) + 


T nn! der! 
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puis on ajoute et l’on retranche 2n(r? — 1)"-1 dans la dérivée du second terme : 


1 1 q E P z 
Pa41(£) = TAE [(x? — 1)" + 2ng? (z? — 1)! — Qn(x? — 1)! + 9n(x? — 1)” 1] 
1 1 q! 


= ai ques nDe =e Fe, 


soit encore : 


1 1 d?-i 
RAS er 


Calculons le premier terme du second membre en utilisant la relation découlant de la règle de 
Leibnitz, cette quantité est égale à : 


2n+1 d”? __2n+1 g 


[(2n + 1)(x° — 1)"] + Pa-1(x). 


(2n+1)z d” 


2 n 2 n 2 n 
S a = 1 
2n! dg”! Le 2 ] n2”n! dx? Gi 1) ] n2n! dx” [a ) ] 
2n+1 2n +1 
= ——— Payı (£) — = zP,(x). 
En définitive, il vient : 
__2n+1 2n +1 


Poi (£) = z Pale) — = LPA(æ) + Pa-1(x). 
On aboutit finalement à la relation de récurrence désirée : 
(n+1)Prn(x) — (2n +1)xP;(x) + nPa-1(£) = 0. (7.4) 
Cette expression jointe à Po(x) = 1 et P(x} = x permet donc de calculer aisément tous les 
coefficients de chaque polynôme de Legendre P, (x) quel que soit n. 


1.3. Relations de récurrence faisant intervenir des dérivées 
Dérivons la formule de Rodriguès par rapport à x, cela donne : 


P! (x)= ERRA {2nx(x? — DS 
F7 On nl den ` 
soit encore, en utilisant la relation de Leibnitz : 
1 1 d” da 1 
P! nl 2 1 n—1l 
n (a) 27-1 (n— 1)! fa dz” ac dx—1 } a T 


d’où une première relation de récurrence entre polynômes et dérivées : 
P (x) = zP) _ (£) + nP-1(x). (7.5) 
La relation (7.5) peut encore s'écrire 
(n + 1)Phsi (2) = (n + 1) {2 Pp (2) + (n+1)P,(x)}. 
D’autre part, la dérivation de la relation de récurrence (7.4) donne : 
(n + 1) Pari (2) = (2n + 1)Pp(2) + (2n + 1)a P, (2) -nP,_1(x). 


La soustraction de ces deux dernières expressions conduit à la seconde relation de récurrence 
entre les polynômes et les dérivées : 


nPal£) = zP} (x) — Pi_;(£) avec n £0. (7.6) 


Ces deux dernières formules sont utiles dans le cadre de l'étude de la méthode d'intégration 
de Gauss-Legendre. 
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1.4. Équation différentielle dont les P,(x) sont solutions 


Dérivons une fois par rapport à x la première relation de récurrence (7.5) faisant intervenir les 
dérivées : 


Pie) = Pix) + £P -1(2) +nPi (x) = (n + 1) Pp il£) + Pale). 
De même, la dérivation de la relation (7.6) donne : 
nP,(x) = £P, (x) + Pp (£) — Pi(x), 
d’où l’on tire : 
Pi_1(x) = —(n—1)P, (x) + 2P; (2). 


n 
n—1 


Éliminons (x) entre ces deux relations : 
Pa (2) = (n — 1)Pa-1 (2) + 2 {P7 (2) — (n — 1)Pp(2)} 
Reste à éliminer P’ _; (x) l’aide de la relation (7.6) : 
P; (£) = (n = 1)[2 P, (x) — nP,(x)] + 2° P3 (2) — (n —1)zP, (x). 
Cette expression ne dépend plus que de P(x) et de ses deux premières dérivées : 


(1 — z?) P! (x) — 2P! (x) + n(n +1)Pa(x) = 0. (7.7) 


Cette dernière relation est vraie quel que soit n, c’est une équation différentielle linéaire du 
deuxième ordre appelée équation différentielle de Legendre. 


1.5. Propriétés des racines des polynômes de Legendre 


Un théorème permet d’affirmer que les zéros de chaque polynôme de Legendre sont simples. 

Revenons à la fonction R2,(x) = K(x° — 1)". Elle possède 2n racines égales à —1 et +1. Le 
théorème de Rolle montre que R°,(x) a une racine réelle entre —1 et +1, et l’on peut ajouter 
que cette fonction a (n — 1) racines égales à —1 et (n — 1) racines égales à +1. En poursuivant 
le calcul jusqu’à la dérivée n ième, on voit que R (x) est un polynôme de degré n qui possède 
n racines réelles comprises entre —1 et +1. Ce sont, en vertu de la formule de Rodriguès, les 
racines de P, (z). 


1.6. Norme des polynômes de Legendre 


Calculons à présent l’expression : 
P p 


+1 +1 
d” d” 1 
== 2 _ K2 2 n 2 n — 
J= Tea dz = K | Ta (æ° — 1) Jar (x-1 dr avec K = ne 
21 21 
Posons 
n d”? 
du = T 2—1) dz et v= re 2—1)”, 
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puis intégrons par parties ce qui donne : 


d”? a, q” ni 
sel ae 1) rei pe} 


Le premier terme à l’intérieur du crochet est nul puisque —1 et +1 sont racines, et de proche en 
proche on obtient : 


(x? — 1)" dr. 


J=K?(-1)" Je 1)” 


—1 


dx?" 


Comme (x? — 1)" est un polynôme de degré 2n (à coefficient principal réduit) que l’on dérive 
2n fois, le résultat est une constante qui vaut (2n)!. Alors, J prend l'expression suivante : 
+1 
J=(-1)" K? (2n)! I , (x? — 1)" dz. 
Il n’est pas très difficile de calculer cette dernière intégrale, pour cela on pose : 
+1 
L= Je — 1)” dg, 

Zi 
expression que l’on intègre par parties. Il suffit d'écrire : 
u = (x? — 1)” et donc du = 2x dæn(x? —1)" t, 


ainsi que dv = dx et v = x; on obtient alors : 

+1 

L = [r(a° — D] — 2n fa — 1)? dx. 
1 
La première quantité (toute intégrée) a une valeur nulle. Une autre intégration par parties 
permet d'écrire : 
+1 
2 
L= gr — 1} jee — 1)? dz. 

11 


On poursuit ainsi de suite les calculs et, en notant par € le signe que l’on déterminera plus tard, 
on arrive à l’expression : 


+1 
1 1 1 
L=e2n-2(n —1)-2(n — 2)... 2 A el 
e2ng (n g (n —2) EN] o fa (x° — 1) dx, 
BSI 


qui conduit à l'expression suivante : 


7. LES POLYNÔMES DE LEGENDRE 


Le problème du signe £ que nous avons délibérément abandonné se trouve résolu en remarquant 

que (x? — 1)” est une fonction qui a le signe de (—1)" sur l'intervalle (—1, +1) ainsi L s’écrit : 
2:4.6...2n 2 

1-3-5... (2n +1)” 


L= (-1)” 


Ensuite, nous pouvons écrire : 


(2n)! 1 1 ur 
n! 2%-11.3.5...(2n+1)  (2n+1) 


Ja 


En définitive, on obtient le résultat suivant : 
+1 
J Perae (7.8) 
i (2n +1) 


1.7. Les premiers polynômes de Legendre 


P(z)=1 

P(x) = x 

P(x) = (3z? — 1)/2 

P(x) = (5x? — 3x)/2 

Pix) = (35x* — 30x°? + 3)/8 

Ps(x) = (63x° — 70x° + 15x)/8 

P(x) = (2317 — 315z + 105x° — 5)/16 
P(x) = (429x° — 693x° + 3157° — 35x)/16. 


1.8. Calcul des coefficients des polynômes de Legendre 


À l’aide de la relation de récurrence (7.4), de Pj(x) et de P.(x), on peut calculer les coefficients 
selon les puissances croissantes ou décroissantes de la variable x des k premiers polynômes de 
Legendre. Dans le cas où l’on utilise un calculateur arithmétique, pour des raisons d'économie 
de place mémoire, on entasse tous les coefficients des polynômes les uns à la suite des autres 
dans un tableau unique à une seule dimension. 

On trouvera sur le Web (*) le programme legendre.c permettant de calculer ces coefficients. 


1.9. Variantes concernant les polynômes de Legendre 


Il n’est pas bien difficile de reprendre cette étude en changeant l’intervalle fondamental (—1, +1) 
qui est remplacé par l'intervalle fini (a, b). Rien d’essentiel n’est changé pourvu que a et b restent 
finis. Il est courant de définir d’autres polynômes de Legendre sur l'intervalle (0,1), et ils sont 
appelés parfois polynômes de Legendre modifiés. On les rencontre lors de problèmes de lissage 
sur l'intervalle de définition (0,1). On en trouve une application intéressante lors du calcul de 
diagrammes de phase. 


*http://www.edpsciences.com/guilpin/ 
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1.10. Une propriété importante des polynômes de Legendre 


Par définition, on dit qu’un polynôme de degré n est à coefficient principal réduit lorsque le 
coefficient du terme de degré n est égal à l’unité. Cette notion sert essentiellement à comparer 
les polynômes de degré n entre eux, sinon ils seraient définis à une constante multiplicative près 
qui ne permettrait plus de comparaison. 


Théorème — Parmi tous les polynômes de degré n à coefficient principal réduit, celui dont la 
norme, évaluée sur l'intervalle (—1, +1), est la plus petite est le polynôme de Legendre, la norme 
envisagée étant celle du produit scalaire (la fonction poids étant égale à l'unité). 

Désignons par G,(x) un polynôme répondant à la question et décomposons-le selon une 
combinaison linéaire de polynômes de Legendre, opération toujours possible. On note par un 
astérisque les polynômes de Legendre à coefficient principal réduit et l’on écrit par conséquent : 


Gn(2) = PO) Pret) 
k=1 


où les ax sont des coefficients constants. La norme de G,(x) s'écrit : 


+1 


GG) = f 


—1 


T 2 
P(x) + 5 ax Pr _,(x)| dz 
k=1 


Soit encore : 
N[Gn(£)] = N [P (2)] + San [Pirla]. 
k=1 


Ce second membre est minimum lorsque tous les ax sont égaux à zéro. I s'ensuit que N [Gn (æ) 
est minimum quand G,(x) = Pž (x), ce qui démontre le théorème. 


1.11. Fonction génératrice des polynômes de Legendre 


Nous admettrons le résultat suivant sans démonstration : 
1 pe; 
Vi — 2hz + h2 


ainsi que cette autre expression : 


Po(z) + hP (£) +R? P(x) ++ RP, (x)+... 


Pa (£) = 


air 


j (z 2m V/{a? = 1) cos 2) à dọ. 
0 


1.12. Décomposition d'une fenction f(x) en série de polynômes de Legendre 


On considère une fonction f(x) continue sur l'intervalle (—1, +1) ou éventuellement ayant des 
points de discontinuité de première espèce en quantité dénombrable. D’une façon tout à fait 
analogue à l'analyse de Fourier, on se propose de rechercher un développement de f(x) sous 
forme d’une combinaison linéaire de polynômes de Legendre : 


f(z) — de) 
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En multipliant chacun des membres par P(x) puis en intégrant sur l'intervalle (—1, +1), on 
obtient : 


+1 +1 
J tore) dr — J EPA) dz. 
“1 1.10 
Soit encore : 
+1 Le +1 
f f(x) Pk(x) dz = Ÿ an J Pa(£)P;(£) dx, 
11 ne o a 
et compte tenu des relations d’orthogonalité : 


+ 


+ z 
, f(x)Pk(x£) de = ak J PePe) dg = ap 


2k + 1” 


1 


ce qui donne : 


2k+1 
2 


âk = 


front) dz. 


En toute rigueur, il faudrait justifier légalité entre f(x) et son développement selon une étude 
analogue à celle effectuée à propos des séries de Fourier : il faudrait associer la série à la fonction 
f(x) et déterminer à quelles conditions légalité peut être obtenue. 


1.13. Décomposition d'un polynôme quelconque en polynômes de Legendre 


Considérons un polynôme quelconque de degré n : 
n 
Qn(x) = N apa” t avec ao Æ 0. 
k=0 


que l’on se propose de décomposer sur la base des polynômes orthogonaux de Legendre P;(x) 
que l’on écrit : 


j 
P;(x) = 5 jmt 7. 
m=0 
Le principe de la décomposition est très simple, il suffit de remarquer que le polynôme 


Qn(x) — a Pala) 


est un polynôme de degré n — 1, désignons-le par Il, _1(x). Ses coefficients sont donnés par : 


a ä k E p 
In-i(£) = Qu(r) — LP, (x) = (a — an )r”! + (a2 — —Layi)r" ? 
no Qno Qno 
a n—l1 nei 
+ (a3 — —an3)t"? +... = X (ak Te D prani 
no rA H — 
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Il n’y a pas de difficulté à calculer les coefficients 8, donc à partir de ce moment nous sommes 
ramené au problème précédent à cette différence près que les polynômes mis en jeu ont perdu 
un degré : nous sommes passé du degré n au degré (n — 1). Par ce procédé, nous arriverons 
au degré zéro, et il est très aisé d'effectuer cette décomposition en calcul automatique, et l’on 
trouvera sur le Web (*) le programme dcomleg. c réalisant cet algorithme. 


+1 
1.14. Calcul de f x"P,dx 
= 


On peut toujours décomposer x” en polynômes de Legendre selon la manière qui vient d’être 
décrite, on obtient : 


m 
g = ` BpPn-k(£), 
k=0 
et comme : 
n 
P,(x) — y Anja”, 
j=0 
on peut écrire sous la forme : 


a” = ÈP, (x) + D BkPa_x(x). 


An0 kol 
Il est aisé de déduire : 
+1 à 5 
Je n(æ) dx do NET” 


=I 


en tenant compte des relations d’orthogonalité. Cette relation est utile lors de l'étude de la 
méthode d'intégration de Gauss. 


2. Méthode d'intégration de Gauss-Legendre 


2.1. Position du problème 
On se propose de calculer numériquement l'intégrale : 
b 
= f F(t) dt (7.9) 
a 


lorsque celle-ci, bien entendu, a un sens et que les bornes d'intégration a et b demeurent finies, 
en outre F(t) ne comporte pas de singularités notamment aux bornes du domaine d'intégration 
c'est-à-dire en a et b. Avant d'entamer ce calcul, remarquons que le changement de variable : 


a+b b-a 


t= 
2 72 


* http://www .edpsciences .com/guilpin/ 
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ramène le domaine d'intégration à l'intervalle fondamental (—1, +1), ce qui donne : 


b +1 
I= fro dt = fto dz. - (7.10) 


La méthode de Gauss pour évaluer numériquement l'intégrale 7 consiste à : 


a. adopter pour valeur approchée de I l’expression suivante : 


F=S Hifi): (7.11) 


k=0 
b. choisir un critère pour déterminer les zp et les Hg. 


L'examen de la formule (7.11) montre qu’il y a (n + 1) valeurs xx à déterminer ainsi que 
les (n + 1) valeurs A4 qui leur correspondent. Pour obtenir ces valeurs, on retient comme 
critère l'égalité rigoureuse des expressions (7.10) et (7.11) dans le cas particulier où f(x) est un 
polynôme, et on fera en sorte que le degré du polynôme soit le plus élevé possible pour n fixé 
arbitrairement (n figure dans la relation (7.11)). Comme il y a 2(n + 1) coefficients arbitraires, 
le polynôme sera au plus de degré (2n + 1). 

Dans le cas général où f(x) n’est pas un polynôme, on peut espérer une bonne approximation 
en vertu du théorème de Weierstrass selon lequel toute fonction continue sur un compact (a, b) 
peut être approchée uniformément par un polynôme. Bien sûr, le théorème de Weierstrass 
est très postérieur à la méthode de Gauss - un petit siècle les sépare — néanmoins on peut 
remarquer que, dans le cas où f(x) est continue et possède des dérivées successives continues 
sur le compact (a,b), le développement en série de Taylor montre que f(x) peut se développer 
selon un polynôme de degré n, à une approximation près qui est donnée par le reste de la formule 
de Lagrange. Quoi qu’il en soit, un calcul d’erreur fondé sur cette remarque viendra apporter 
tous les éclaircissements utiles. 

On trouvera à la page 46 de l'ouvrage de Crouzeix et Mignot cité en bibliographie la 
démonstration de l’unicité d’une telle formule d’approximation qui vaut pour toutes les méthodes 
de Gauss que l’on va rencontrer par la suite. 


2.2. Calcul des abscisses xx 


Supposons que f(x) soit un polynôme Q,(x) de degré n. Ce polynôme peut toujours s'exprimer 
au moyen d’une combinaison linéaire unique de polynômes de Legendre de degré égal et inférieur 
à n. Soit : 


f(x) = Qu(x) = X 4;P;(x) 
j=0 


expression dans laquelle P;(x) est le polynôme de Legendre de degré j et À; le coefficient 
numérique de la décomposition. En vertu des relations d’orthogonalité, nous pouvons écrire : 


+1 


M= Jow Pana) dr = f Rat) and YA fr Pt des 0) 


—i 
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En introduisant la relation (7.11), nous obtenons l'expression suivante : 


n 
M=0= XO HjQu(t;)Pari(ts). (7.12) 

j=0 
Comme cette relation doit être vérifiée quel que soit le polynôme Q,(x), de degré égal ou 
inférieur à n, et comme par ailleurs les Hg ne peuvent être nuls sinon le nombre des abscisses 
£k s’abaisserait, on en conclut nécessairement que P,41(x;) est nul. Il s'ensuit que les +4 sont 
les (n + 1) racines du polynôme de Legendre de degré (n + 1). À ce propos, nous savons que 

toutes les racines de P,,1(x} sont réelles, distinctes et comprises dans l’intervalle (1, +1). 


Remarque 1 : Avant de poursuivre plus avant les calculs, d’ores et déjà, il est possible de voir 
que la précision de la méthode de Gauss sera d’autant plus grande que le polynôme Q,(x) qui 
approche la fonction f(x) sera de degré plus élevé. 

Remarque 2 : Puisque toutes les racines de tous les polynômes de Legendre appartiennent à 
l'intervalle (—1, +1), la méthode de Bairstow va se révéler particulièrement pratique et efficace 
pour obtenir les valeurs numériques des racines. 

Remarque 3 : Il est important de constater que les valeurs xx ne dépendent pas de la fonction 
à intégrer et sont donc des constantes universelles, elles pourront être rentrées une fois pour 
toute dans un calculateur. 


2.3. Calcul numérique des racines xx des premiers polynômes 


À l’aide de la méthode de Bairstow, nous allons calculer les racines des k premiers polynômes de 
Legendre. Comme ces valeurs sont universelles, il est bon de les obtenir avec une bonne précision, 
ne serait-ce que pour les employer lors de calculs réalisés sur les petites machines portatives. 
Bien entendu, si l’on dispose d’une possibilité d'effectuer les calculs en double précision, il est 
recommandé de l'utiliser. On a reporté sur le tableau 7.3, page 131, les valeurs numériques des 
racines du polynôme de degré 13. Cette limitation est due au fait que seulement 16 chiffres 
significatifs ont été utilisés et qu’il en faut davantage pour calculer les racines des polynômes de 
degré supérieur à 13. 


2.4. Calcul des coefficients H4 


Puisque le polynôme de Legendre P,:1(x) ne possède que des racines réelles et simples, nous 
pouvons l’exprimer en fonction directe d’un produit de monômes : 


n 
Pa+1(£) = ao, n41 Ile — Tj) 
6 


ao,n+1 étant le coefficient du terme de degré le plus élevé dans le développement de P,41(x). À 
présent considérons le polynôme Q,,4(x) de degré n, ainsi défini : 


Qula) = ZHE) Z aona [Jæ 2) 


Puisque l’expression (7.11) doit donner une valeur exacte de l'intégrale de Qng (£), nous pouvons 
écrire : 


n 


+1 n n 
L= fono) dz = X HiQnelz;) = A0,n+1 SH; [Lt — Ti). (7.13) 
—1 3=0 j=0 i=0 
i£k 
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Le second membre a toutes ses sommes nulles sauf une seule lorsque j = k. Nous obtenons : 


r= font dg = ao,n+1 Hk [Tex — mu) = HkQnk (Tk), 


ižk 
i=0 
expression à partir de laquelle on tire : 
Hp = j Qnk(x) dz. 
EN Tk) k ) 


Une expression de Qng(£k) plus commode à exploiter est souhaitable, et pour cela calculons la 
dérivée de P,41(x) ; nous avons : 


1 
Pris A lecs 
j=0 i=0 
ižj 


et pour £ = £k nous obtenons : 


Phare) = Gon+1 | [(®x — mi) = Qnr (2x). 
ik 
L'expression (7.13) se transforme alors en une expression ne faisant intervenir que le polynôme 
de Legendre de degré (n + 1) ainsi que son polynôme dérivé : 
+1 


L= Hk a+ (2k) = f 


—1 


Posila) 
L ER 


dg. 


Cette dernière expression permet en principe de calculer les coefficients H} qui ne dépendent 
que des polynômes de Legendre et de leurs zéros. Insistons sur le fait qu’ils ne dépendent pas de 
la fonction dont on cherche à calculer l’intégrale de façon approchée. On obtient en définitive : 


+1 
1 Pa+1() 
Hk = z) dz. (7.14) 


d 
Pr T —Tk 

Nous allons procéder à la transformation de l'expression (7.14) qui n’est pas encore d’un 
emploi très commode. Pour ce faire, considérons l'expression suivante : 


+1 


f Pena Zee dz. (7.15) 


£ — Ëk 
21 
On voit immédiatement que (x — zx) est une racine de P,(x) — P,(xx) et que par conséquent 
Pa(x)—P(xx)}/(x—æx) est un polynôme de degré (n—1). En vertu de la relation d’orthogonalité 
et du théorème de décomposition, l'intégrale (7.15) est nulle. Développons cette expression : 


+1 +1 


= ORG _ Pia) f ZEO ae, (7.16) 


T — Tk T — Tk 
—1 —1 
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Évaluons le premier terme : 


+1 
T= Î Pasi (2) Pala) à. 


T — Tk 
=I 


Comme Pa+ı(x£) admet un développement du genre : 
Poyi) = aonya” t! + ain” +2 + Anime 
et comme d’autre part xx est une racine du polynôme, on peut écrire : 
Pa (x) — (x = zk)(bon+17" + bi Rss bnn+1); 
par identification, on note que : 
Gont1 = bon+1: 


En tenant compte des relations d’orthogonalité, T s'exprime alors de la façon suivante : 


+1 
Gon+1 2 
T = n nP d = LR . 
Jo +12” Pa(£) dz aon n+l 
1 


En revenant à l'expression (7.16), on peut alors écrire : 


ET 1 A0,n+1 2 
T — Tk ” P,(&) aon 2n +1 


en remplaçant dans l'expression (7.14), on obtient : 


1 l ony 2 


H= | 
i Pipil) Palak) aon 2n+1 


La relation de récurrence entre trois polynômes consécutifs permet d'obtenir directement 
a0,n+1/40,n en identifiant les termes de degré (n + 1) ; on obtient la valeur (2n + 1)/(n +1). En 
définitive, Hpk prend une forme très simple : 


1 1 2 


Hy = ; 
ET Pak) Paler nt l 


(7.17) 
Il existe une autre forme de H, très utile à connaître parce que très facile d'emploi. Éliminons 
P! _ (£) entre les relations de récurrence (7.13) et (7.14) ; on obtient : 
(1 — 2?) P! (£) — nP- (£) — ne Pa (x) = 0. 
Remplaçons n par (n + 1) et x par zą dans cette expression, nous obtenons : 
(1 -= zp2)Papi (£k) = (n + 1)Ph (£x). 
Il suffit de reporter la valeur de (n + 1)Pp (£x) dans la relation (7.17) pour écrire : 


2 , 
Hk = er s (7.18) 
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Cette formule est d’un emploi plus intéressant que la relation (7.17) non seulement sur le plan 
de la programmation mais aussi sur le plan du temps de calcul. 

Il n’y a pas de difficulté particulière pour obtenir ces valeurs numériques dans la mesure où 
les coefficients des polynômes ainsi que les racines ont été convenablement placés dans un ou 
des fichiers. 

On trouvera sur le Web (*) le programme r_legend.c calculant les H. 


2.5. Retour sur le calcul de l'intégrale définie sur (a, b) 


Nous avons montré que le changement de variable : 


__b+a y b-a 

T2 2 
nous ramène à l'intervalle (—1, +1). Par conséquent, il suffit alors de calculer : 

b+a b-a 
Yk = 9 + 9 Tk. 
Les Hp n'étant pas modifiés, on peut écrire les deux relations : 
=X Hf (2k). 
k=0 


Le cas des intégrales continues par morceaux — c’est-à-dire présentant des discontinuités de 
première espèce — est justiciable de la méthode de Gauss : on calcule autant d’intégrales qu’il 
y a d’intervalles sur lesquels la fonction est continue, et chacune des intégrales se ramène au cas 
qui vient d’être présenté. 


2.6. Calcul de l'erreur commise lors de l'approximation 


Supposons que f(x) soit une fonction continûment différentiable sur l'intervalle fini (canonique) 
(—1, +1). Le développement de Taylor-MacLaurin à l’ordre (2n + 1) nous donne : 
anti x?n +2 


OR R SPORE er A 


expression dans laquelle x et £ appartiennent à l’intervalle (—1, +1). 
Intégrons terme à terme cette expression, on obtient : 


+1 
1= | (0) à -240+ AO ++ AO) ++ ee A) 


+5 +1)! (2n +3)! 


On remarque que toutes les dérivées d'ordre impair disparaissent lors de l’intégration. 
L'exploitation directe de la relation (7.11) donne : 


J = f(0) SH + TW Se + RQ Yna 


1! 2! 
k=0 k=0 k=0 
fem (0) $ FED (0) À an | FEE S 2n+2 
m +... Hyr” Hya?” 
RE 2 Hi On + 1)! > k T nt?) > Hery 


* http://www .edpsciences .com/guilpin/ 
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Si f(x) est un polynôme de degré (2n + 1), la dérivée de f(x) d'ordre (2n + 2) est nulle, et Pon 
a légalité : 


T=J. 


Dans ce cas il n’y a pas d’erreur mathématique due à une approximation; on obtient en 
conséquence le système suivant : 


De =0, (7.19) 
k=0 


expressions dans lesquelles les sommations s'effectuent pour k variant de 0 à n. 

Il est intéressant de constater que le système de (2n + 2) équations ainsi défini est constitué 
de (2n +2) équations non linéaires dans la mesure où l’on considère que les Hg et les x; sont les 
inconnues. En revanche, si l’on connaît les gẹ, alors, (n + 1) équations quelconques prises dans 
le système précédent constituent un système linéaire permettant de calculer les Hg. 

Toujours est-il que l’erreur prend la forme suivante : 


fee) 2 Z 2n+2 
FO (2n +2)! | 2n +3 2 Hit i (0) 


en prenant soin de remarquer que : 


= 2 
H 2n+2 . 


Bien entendu, comme toutes les fois en pareil cas, on recherche une majoration la plus raisonnable 
possible de la fonction f?”+2(¢) dans l'intervalle (—1, +1), en définitive, l'erreur s'exprime de 
la manière suivante : 


M. 2 = 
E = 2e Hyr? 7.21 
(2n +2)!) | 2n +3 2 RE (2) 
où Moni2 = sup | fr+2) (>) pour z appartenant à (—1,+1). 


128 


7. LES POLYNÔMES DE LEGENDRE 


Dans la mesure où l’on peut obtenir une majoration Mən+2, E donne l'erreur mathématique 
liée à la troncature de la série des polynômes de Legendre. Viendront s'ajouter lors des calculs 
effectifs les inévitables erreurs d’arrondi propagées par l'exécution des opérations. 

Bien qu’elle soit très intéressante, cette expression n’est pas d’un emploi très commode dans 
la mesure où figure une dérivée d’ordre (2n + 2). Le calcul devient très souvent arborescent et 
rapidement inextricable, quand à la majoration, elle risque de devenir catastrophique dans la 
mesure où elle est très surestimée. 

Table des valeurs numériques de n = [z —) 0H, paina) — Les valeurs du tableau 7.1, 
sont directement tirées du du fichier Legendre.txt sur le Web Œ) où figurent les racines et les 
poids associés des premiers polynômes de Legendre. 


Tableau 7.1. 
Degré Erreur 

du polynôme mathématique 
2 0,177 778 
3 0,457 143 107! 
4 0,116 100 107! 
5 0,293 181 107? 
6 0,738 079 107° 
7 0,185 46610 
8 0,465 483 1074 
9 0,116 731 1074 
10 0,292 559 10 
11 0,732912 107° 
12 0,183 0547 1076 
13 0,459 546 1077 


2.7. Un exemple numérique, comparaison avec d’autres méthodes 
Nous avons choisi un exemple dont on connaît directement le résultat par quadratures : 


+1 


1 
T= | zig +a) dr = 2. 
0 


Voici les résultats obtenus par la méthode de Gauss, la méthode des trapèzes et la méthode 
de Simpson. 


a — Méthode de Gauss 


5 points: Z = 0,249 999 996 
6 points: T = 0,249 999 999 909 


*http://wuw.edpsciences.com/guilpin/ 
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b — Méthode des trapèzes et méthode de Simpson — En 6 points la méthode de Gauss est 
un peu plus précise que la méthode de Simpson en 100 points. tandis qu’il faut 40 points à 
la méthode de Simpson pour obtenir une précision analogue à celle de la méthode de Gauss en 
5 points. 


Tableau 7.2. 
Méthode des trapèzes Méthode de Simpson Nbre de points 
0,250 248 0,250 000 086 20 
0,250 062 0,250 000 005 4 40 
0,250 027 0,250 000 001 07 60 
0,250 009 9 0,250 000 000 138 100 


c — Calcul de l'erreur concernant l'exemple — Par chance, le calcul de la dérivée n° de 
x log(1 + x) est relativement aisé, et l’on peut montrer que : 


ioga +2) = ren 


Effectuons le calcul d’erreur pour 6 points : 


2 ! 
E= Me E z Sma) = 7,381 10-70 Ii, Mo= re 
car nous avons dû effectuer un changement de variable x = 5 + t pour nous ramener à 
l'intervalle canonique (—1, +1). Alors nous pouvons écrire : dx/ dt = 1/2 et (Er = a 
Rappelons que, avec l'écriture choisie, z appartient toujours à (0,1), et que re z 


2 
M2 est une fonction monotone décroissante dans lintervalle (0,1), elle est maximum pour 


— a | i N ! 
x = 0. Donc M: est plus petit ou égal à Ix2x 20 
On tire une valeur de E : 
7,38110 
= =——— = 0,810 $. 
11 x 8192 i 


On s'aperçoit que l'erreur E est environ 100 fois plus grande que l'erreur observée directement ; 
cela est dû à la majoration de la fonction M2. En x = 0, la dérivée est 3780 fois plus petite 
qu'au point x = 1. On en conclut que l'erreur est comprise entre 2 10712 et 0,81078. L'évaluation 
directe de l'erreur se situe bien dans ce créneau puisqu’elle est de l’ordre de 1071? et cet exemple 
montre bien combien la majoration d’une dérivée d’ordre n peut être pénalisante pour un calcul 
d'erreur. 


Remarque : Pour utiliser aisément la méthode de Gauss, il suffit de fabriquer un sous- 
programme dans lequel on rentre une fois pour toutes les racines et les poids du polynôme 
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Racines et poids associés des polynômes de Legendre. 


Degré Racines x Poids H, 
0,0 0,232 551 553 230 874 
+0,230 458 315 955 13 0,226 283 180 262 897 
0,448 492 751 036 45 0,207 816 647 536 88 
13 +0,642 349 339 440 33 0,178 145 980 761 94 


+0,801 578 090 733 3 
0,917 598 399 223 
+0,984 183 054 718 5 


0,138 873 510 219 8 
0,092 121 499 837 7 
0,040 484 004 765 


de degré 12 ou 13 (ensuite, des problèmes de précision apparaissent avec des représentations sur 
16 chiffres significatifs et des racines complexes apparaissent...) ; il suffit d’ailleurs de rentrer 6 
racines et 6 poids associés à cause des symétries, les racines sont deux à deux opposées. 


On donne sur le Web (*) un fichier texte appelé legendre.txt où l’on trouvera les racines et 
les poids des treize premiers polynômes de Legendre. 
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O |Les polynômes de Tchebycheff. 
Application à la méthode 
de Gauss-Tchebycheff 


1. Les polynômes de Tchebycheff (1821-1894) 


1.1. Première définition 


La relation de définition des polynômes de Tchebycheff est donnée par l'expression suivante : 
T3 (x) = cos(n arccos x) (8.1) 
ce qui implique que : 
Tọ(z)=1 et Ti(x) = x. 


Ils obéissent à une relation de récurrence que nous allons établir. Pour cela, il suffit de poser 
y = arccos x, on obtient : 


TF(x) = cos ny. 
Écrivons T*,,(æ) et T*_,(x) et cffectuons-en la somme : 
Thy (£) = cos(n + l)y = cos ny cosy — sinnysiny, 
T3_ (£) = cos(n — l)y = cos ny cos y + sin nysin y, 
True) + Tž(x) = 2cosny cosy = 2x7} (x) 
D'où la relation de récurrence cherchée entre trois polynômes consécutifs : 


Tue) — 2279 (x) + Thi (2) = 0. (8-2) 


À présent nous allons montrer que ces polynômes sont orthogonaux. En partant de la relation : 
KiS 
cos nt cos mt dt = nt /2fmn 


0 


Ômn étant le symbole de Kronecker (1823-1891), sauf pour n = m = 0 l'intégrale vaut r. 
Effectuons le changement de variable t = arccos x, soit x = cost, ce’ qui nous permet d'écrire : 


dt = — sin z dx 
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et 
dx = ne, 
Ar 
puis 
T + 
fos nt cos mt dt = Î Teale) dr =0 simin 
Le vi-a? 
et 


Î T*(z)T* (x) dz 
V1 — zr? 


Kig 
T 
= J cos? nt dt = 5 si n est différent de zéro 
0 


ag si n—=0(. 


On voit que les polynômes de Tchebycheff sont orthogonaux sur l’intervalle fondamental 
(—1,+1) relativement à la fonction poids re qui est une fonction définie positive sur cet 
“m 


intervalle. 


1.2. Seconde définition 


Cette suite de polynômes orthogonaux peut être avantageusement modifiée pour le propos qui 
nous préoccupe. On peut définir la suite de telle sorte que le coefficient de degré le plus élevé 
pour chaque polynôme soit égal à 1. Nous allons donc définir une suite polynômes à coefficient 
principal réduit. Si nous examinons la relation (8.2), nous nous apercevons que le coefficient de 
degré le plus élevé est multiplié par 2 lorsque l’on passe du polynôme de degré k à celui de degré 
(k + 1). Il nous suffit de poser comme relation de définition une nouvelle expression : 


1 
Tax) = na cos(n arccos x). (8.3) 
La relation de récurrence est alors légèrement modifiée et devient : 
Tn1(x) — 4xTh (x) + 4Tn— (£) = 0. (8.4) 


Il va de même de la norme qui s’exprime : 


+1 
T2 dz T 
7 = ——— sin est différent de zéro 
/1 +579 22n-1 
=T si n = 0. (8.5) 


2. Une propriété essentielle des polynômes de Tchebycheff à coefficient 
principal réduit 


2.1. Théorème 


De tous les polynômes de degré n à coefficient principal réduit, c'est le polynôme de Tchebycheff 
Th(x) qui approche le mieux l’axe des x sur l'intervalle (—1,+1) au sens du sup du module. 
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2.2. Démonstration 


Désignons par p,(x) un polynôme répondant à la question et considérons alors la fonction : 
f(£) = pna (£) — Tn (2). 


Puisque p,(x) et Ta(£) sont à coefficient principal réduit, f(x) est un polynôme au plus 
de degré (n — 1). Par ailleurs, T, possède n extremums alternativement positifs et négatifs sur 
l'intervalle (—1, +1), tous égaux en module à 1 et dont les abscisses sont données par la relation : 


k 
a = cos ( £T) avec k = 0,1,2,...,(n— 1). 


Quand T,(x4) est positif, f(z) est négatif et quand T,(x4) est négatif, f (xx) est positif, il 
s'ensuit que f(x) est alors un polynôme n fois positif et négatif alternativement sur l'intervalle 
(—1, +1). Il change donc (n — 1) fois de signe et par conséquent possède n racines. Donc, f(x) 
doit être un polynôme de degré n, ce qui est en contradiction avec le fait que f(x) est au plus 
un polynôme de degré (n — 1). On en conclut que le polynôme f(x) est identiquement nul et 
que Paix) = T(x) ce qui démontre le théorème. 


3. Les racines des polynômes de Tchebycheff T, ,1(x) 


On sait que le polynôme de degré (n+1) possède (n+1) racines distinctes et réelles sur l'intervalle 
(—1,+1). On les obtient en écrivant T,41 = 0, soit : 


cos[(n + 1) arccos x] = 0, 


ce qui donne : 


n(2k +1) 


Zk = COS 2R+D 


(8.6) 


4. Calcul des poids Hk correspondant aux racines xx du polynôme T,,,1(x) 


Pour cela, il suffit d'exploiter directement la relation (B.5) de l’annexe B. D'abord, on calcule le 
coefficient K qui est égal à J» puisque nous traitons de polynômes à coefficient principal réduit. 
Donc : 


T 


k= D2n—1 


À présent il nous faut calculer T,1(xx) et Tn+1(2K). On trouve les expressions suivantes : 


j o n+ 1 1 . 
Titre) = E (= sin[(n + 1) arccos 7) 
d’où 
—1)f n+1 
/ Z 
Topilar) = n RE D 
2(n +1) 
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puis il vient 


1 1 2k+1 
Talk) = Ja cos(n arccos £k) = zn- COS n R i 


Cette dernière expression, après quelques transformations trigonométriques, se réduit à : 


(DE OET 
DEL DRE) 


Talk) = 


De là on déduit la valeur des H} : 


K T 
és = i 8.7 
em aa n+l (8.7) 


Cette expression montre que tous les Hg sont égaux pour un polynôme donné, ce qui, notons-le 
au passage, conduira à des calculs particulièrement simples. 


5. Méthode d'intégration de Gauss- Tchebycheff 


Il est usuel ď’associer au nom de Gauss le nom du savant qui a laissé son nom à une suite 
particulière de polynômes orthogonaux. C’est pour respecter cette tradition que nous désignons 
par les deux noms accolés la méthode qui nous permet de calculer numériquement les intégrales 
du type : 


OF à 
p f Aa (8.8) 


que l’on approche donc par l'expression classique : 


laquelle se simplifie notablement : 


J=HY fe) = CSa (cos Tarn) (8.9) 


k=0 k=0 


avec k = 0,1,2,...,n. Il est bien entendu que la fonction f(x) est régulière sur l'intervalle 
(—1,+1). Par ailleurs, nous ne croyons pas utile de devoir donner la liste des racines des 
polynômes de Tchebycheff et des poids Hkg qui leur sont associés, puisque les expressions 
mathématiques qui permettent leur calcul sont très simples. 


6. Calcul de l'intégrale | = I NEOA 


Le changement de variable : 
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nous permet de nous ramener au problème précédent car l'intégrale s’écrit : 


+1 (+) 
1= | dy. 


1-7 


21 
Par conséquent, on calcule 7 au moyen de l'approximation : 


b+a b-a 


J= X for) avec Yk = 9 + g Th 


où, rappelons-le, les zx sont, dans cette expression, les racines du polynôme de Tchebycheff de 
degré (n + 1). Le lecteur pourra légitimement s'étonner du fait que l’on utilise les polynômes de 
degré (n +1) et non des polynômes de degré n, la raison en est simple, c’est pour rester cohérent 
avec les expressions établies au chapitre précédent. 


7. Calcul de l’erreur commise lors de l’approximation 


Nous allons reprendre le calcul réalisé lors de l’étude de la méthode de Gauss-Legendre, seuls 
quelques points de détails vont différer. 
Soit à calculer : 


fi 
r= fe 


Supposons que f(x) soit continâment différentiable sur l'intervalle canonique (—1, +1). Le 
développement de Taylor-MacLaurin à l’ordre (2n + 2) nous donne : 


2 g2+1 2n+2 


F0) = FO + LPO + Or 0) + 


T (2n+2) 
On +27 O, 


expression dans laquelle æ et £ appartiennent à l'intervalle (—1, +1). 
Calculons 7 en remplaçant f(x) par son développement, il faudra calculer des expressions du 
type : 


+1 
n 
z 
Q= i — dr: 
V1 — zr? 
“1 
Pour cela, posons x = cos z, soit dg = — sin zdz ; on obtient alors : 


T 


Qn = fo z dz. 


0 
On intègre par parties cette expression en posant : 
v = cos" lx et du = cosg dx 


ce qui donne: du = —(n —1)cos" ?xsinx dz et u=sinz. 
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On peut écrire : 


Kig 


Qnr =(n-1) for z(1— cos? z£) dg = —(n — 1)Qn+(n-1) fosa iz 
À 0 


d’où la relation de récurrence : 
T kin 
nQn = (n-—1)Qn-2 avec Qo= f dr=r et Q = fose dz = 0. 
0 0 


De là, on tire que : 


Qon+1 = 0, 
__Q@n-1)!  (2n—-1)! 
Qan (2n)!! i 27n! 
Revenons au calcul de T : 
de d 2 2n+1 2n+2 
fe Tp T pn an Z pen) E 
E LAC) + AO) + PO ++ amip O+ nra 


o POL FDO n | 


x LS G) =r bo a (20)!  2q! (2n +2)! 20+1(n +1)! 


L'exploitation directe de la formule d’intégration de Gauss-Tchebycheff donne : 


a0 n (2n+2) n : 
J= (n+1)f(0) +... + À OS agaia ERO Sipe, 


L'erreur E s'écrit : 


(24) > n 
s-u-n=r|"0 f(0)+-..+ À põe 1)! Apa) 


24q! 
f0) n eat fer) (€) | (2n + 1)!! 1 2a] 
k=0 


atA UT nF (ae n+i 


Si f(x) est un polynôme de degré (2n + 1), la dérivée de f(x) d'ordre (2n + 2) est nulle, et l’on 
a l'égalité : 


I = J. 


Dans ce cas il n’y a pas d'erreur mathématique due à une approximation ; on obtient en 
conséquence le système suivant : 


1 ga — (2q — 1)!! 
ko ! 
n+l i 29q 
1 Z 2q+1 
n +1 Di p 
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Bien entendu, comme toutes les fois en pareil cas, on recherche une majoration la plus raisonnable 
possible de la fonction f(2"+2)(£) dans l'intervalle (—1, +1) ; en définitive, l’erreur s’exprime de 
la manière suivante : 


Mon+2 (2n +1)! LS 
E = n+2 1 
(x) (2n + 2)! Le FIN n41 2% ; (8.10) 


2n+2 


où Mon+2 = sup |z (x)| pour x appartenant à (—1, +1). 

Dans la mesure où l’on peut obtenir une majoration raisonnable Mən+2, E(x) donne l'erreur 
mathématique liée à la troncature de la série des polynômes de Tchebycheff. Viendront s’ajouter 
lors des calculs effectifs les inévitables erreurs d’arrondi propagées par l'exécution des opérations. 
Toujours est-il que pour n = 12, on trouve : 


E4 = 1,4710 “Ma. 


8. Fonctions génératrices des polynômes de Tchebycheff 


Nous admettrons les résultats suivants sans démonstration : 
l—tx 


anse © De) +Mi(e) + PT2) +2 Tale) 


et 


t t? ir 
exp(rt) cos(ty 1 — z?) = To(£) + 1e) + z Pe) ++ PAC) +e 


9. Un exemple d'intégration 


À titre dexemple, calculons l'intégrale : 


+1 
1 cos 


rl Ae 
—1 


K dé = Jo(1). 


Cet exemple n’est pas tout à fait gratuit ; en effet, la méthode d'intégration de Gauss-Tchebycheff 
constitue la meilleure façon de calculer les fonctions de Bessel de première espèce. Nous 
reviendrons sur ce point au cours de l’annexe F. 

Pour l'instant, Jo(1) est la valeur de la fonction de Bessel de première espèce d’ordre zéro 
pour la valeur 1 de l’argument. Nous avons trouvé dans la littérature la valeur suivante : 


Jo(1) = 0,765 197 686 557 966 4 


avec une précision absolue de l’ordre de 10715. 

Le tableau 8.1, page suivante, donne les résultats obtenus. 

Si l’on poursuit le calcul pour des valeurs plus élevées de n, seul le dernier chiffre significatif 
change, soit le 16° chiffre... ce qui constitue un résultat remarquable. 
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Tableau 8.1. 


Nombre de points J(1) 


0,765 239 563 

0,765 197 498 111 
0,765 197 687 084 089 
0,765 197 686 556 966 
0,765 197 686 557 967 7 
0,765 197 686 557 966 2 
0,765 197 686 557 966 4 


© Nan À © 


Note importante 


Il faut faire attention à ne pas confondre la méthode d'intégration de Gauss-Tchebycheff avec 
la méthode d'intégration de Tchebycheff ; cette dernière consiste à évaluer l'intégrale : 


au moyen de l’approximation 
n 
J = 5 Hyf (xk) 
k=0 


où les Hp ont été choisis a priori. 

Comme précédemment, on cherchera à fixer les xp de telle sorte que I = J pour un polynôme 
de degré le plus élevé possible. Cette modification des conditions, apparemment anodine, change 
complètement le fond du problème tant et si bien que non seulement la solution dépend alors 
des AH}, mais encore que les +; peuvent ne plus être réels. Même lorsque tous les Hp sont égaux, 
les zk cessent d’être tous réels à partir de n = 8, excepté toutefois pour n = 9. Quoi qu’il en 
soit, la méthode est moins précise que celle de Gauss. 
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9 |Les polynômes de Laguerre. 
| Méthode d'intégration 
de Gauss-Laguerre 


Les polynômes de Laguerre (1834-1886) sont orthogonaux relativement à la fonction poids 
exp(—x) sur l'intervalle (0,00). On peut aborder l'étude de ces polynômes d’une façon tout à 
fait analogue à celle que nous avons adoptée pour les polynômes de Legendre, cependant, nous 
avons préféré utiliser une formule semblable à celle de Rodriguès pour établir plus rapidement 
leurs principales propriétés. 

Par définition, les polynômes de Laguerre sont donnés par les expressions : 


n 


L, (x) = expla) -Es {exp(—x)x"}. (9.1) 


1. Relation de récurrence entre trois polynômes consécutifs 


À partir de la relation de définition, nous allons établir une relation de récurrence entre trois 
polynômes consécutifs, ce qui nous permettra par la suite de calculer facilement les coefficients 
de l’un quelconque des polynômes de Laguerre. Il suffit d'écrire la relation de définition pour 
l'indice (n + 1), ce qui donne : 
dt já 
Liz) = exp(r) -znt {exp(~e)z" t}. 


Soit : 


n 


Ln (£) = exp(x) {-exp(=x)r"™! + (n+1)exp(-z}r"}. 


dg” 
On transforme cette dernière expression à l’aide de la formule de Leibnitz : 
dq” dq” 
a (P(e) t} = i fexp(—x)a"a} 
n n—1 


er {exp(—-x)x"} +n {exp(—x)x"}. 


L'expression donnant L,:1(x) devient : 


n—1 


Lait) = (n+1)La(x) — Ln (£) — nexp(x) J 


Jer l {exp(—zx)x"} + 
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On calcule directement le dernier terme du second membre à partir de la relation (9.1) : 


n— 


E E E 


TE a E z)r" 1 — exp(—x)z"}. 


soit encore, 


n—1 


L, (x) = exp(r) {n exp(—x)z"" | 


— exp(—-x)z"}. 
Il vient donc : 
Le) = (n+1)La(æ) - zLn(2) + nLn(x) - n?Lu_1(à) 


De là nous tirons la relation utile pour déterminer les différents polynômes connaissant les deux 
premiers : 


Lux) + (x — 2n — 1)Lu(x) + n°Lh_1(x) = 0. (9.2) 


2. Relation de récurrence faisant intervenir la dérivée 


À présent, nous allons établir une autre relation très intéressante pour le calcul des coefficients 
Hp. Il s’agit de pouvoir exprimer simplement la dérivée L(x). Cela nous sera bien utile 
pour calculer les Hp de la formule de Gauss généralisée. Dans ce but, dérivons la relation de 
définition (9.1), ce qui permet d'écrire : 


L (£) = nopla) -= — {expl-z Rte he 
soit : 
L! (x) = Lrexp(r) E — {ep(- gje” Ti}, 


Toujours à l’aide de la relation de Leibnitz, transformons cette dernière expression : 


te jet he 


d” 
n- Jgn] 


d” n—1 d? n 
T-n {exp(—-x)r""} = Te {exp(—-x)x"} 
On en déduit directement que : 


al (£) = nLn(£) — nln- (x). (9.3) 


3. Les premiers polynômes de Laguerre 
La relation de définition permet de calculer les deux premiers polynômes, soit : 


Lo(x) = 1, 
Liz) = -x+1 


La relation de récurrence (9.2) montre que le polynôme L,,,1(x) a un degré supérieur de 1 
unité à celui du polynôme de degré n. Cela démontre au passage (en utilisant un raisonnement 
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par récurrence) que nous avons bien affaire à des polynômes, car Lo(x) et Li(x) sont bien des 
polynômes donc L, (x) est aussi un polynôme et ainsi de suite. Voici les premiers polynômes de 
Laguerre : 


Lo(x) = 1 

Liz) = -x +1 

La(x) = x? — 4x +2 

L(x) = x + 9z? — 18x +6 

La(x) = zf — 16x” + 722° — 96x + 24 

L5(x) = —x° + 25x4 — 200z? + 600z? — 600z + 120. 


4. Calcul des coefficients des n premiers polynômes de Laguerre 


Il n’est pas très difficile de réaliser un programme destiné à calculer tous les coefficients 
des premiers polynômes de Laguerre. Jls seront entassés dans un tableau unique, par souci 
d'économie, selon les puissances décroissantes. 

On trouvera sur le Web (*) le programme laguerre.c réalisant cette tâche. 


5. Orthogonalité des polynômes de Laguerre 
Les polynômes de Laguerre sont orthogonaux relativement à la fonction poids w(x) = exp(—x) 
sur l'intervalle fondamental (0, co). Pour le montrer il suffit de calculer : 


O0 


Taig | aeol) dz = fo £ {exp(—x)r”} = {exp( z)æ”} dz. 


Pour fixer les idées et sans nuire à la généralité, supposons que nous ayons n < k. Effectuons 
une intégration par parties en posant : 


m 


u = exp(x) qra {exp(—x)z"}, 


d” ae 
du = nexp(x) An {exp(—x)r""!}, 
et 
5 k 
dv = LE {exp(—x)r 
k-1 


— k 
rer {exp(—-x)r"}. 
* http://www.edpsciences.com/guilpin/ 
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Nous obtenons : 


q” n dl VOEN 
Ink = |exp(x) a {exp(—x)z"} Ir {exp(—x)z"} 
0 


T Ki k—1 
- fente) ; {exp(—x)x" t} o {exp(-x)r"} dr. 
0 


dz” dz¥ 


Le premier terme est nul car il contient æexp(—x) en facteur ; en poursuivant l'intégration par 
parties, on arrive à lexpression suivante : 


k-n 


dg¥=nr 


Ink = En! {exp( He dx 


0 
où £ représente le signe de Inx. Le calcul de cette intégrale donne : 


dit-il kI 
Ink = En! dgk r1 {exp( z)t Jo ? 


car ici encore on fait apparaître le terme xexp{—x) en facteur en fin de calcul, et ce terme est 
nul pour x = 0 ct x infini. Donc les polynômes de Laguerre sont orthogonaux par rapport à la 
fonction poids exp(—x) sur l'intervalle fondamental (0, co). 

À présent, il nous reste à calculer la norme de l'intégrale, c’est-à-dire Z,,, car nous aurons 
besoin de cette valeur pour le calcul des Hp. 

Réglons tout de suite le problème du signe : il est nécessairement positif puisque la forme est 
définie positive (carré scalaire). Donc reste à calculer : 


oc 


Tex n! f {expt-0)a"} dz. 
0 
En procédant par parties, on voit que : 
00 
ftev) dz = n!, 
0 
il s'ensuit que : 
Inn = (mF. (9.4) 


En conclusion, les polynômes de Laguerre sont orthogonaux relativement à la fonction poids 
w(x) = exp(—x) et à l'intervalle (0, 00), nous en déduisons donc que les racines de chacun des 
polynômes sont réelles, simples et comprises dans l’intervalle (0, co). 


6. Calcul des racines des premiers polynômes de Laguerre 


On calcule au moyen de la méthode de Bairstow les racines des polynômes de Laguerre. Les 
valeurs numériques du polynôme de degré 12 sont données dans le tableau 9.3, page 149. 
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7. Calcul des poids H4 correspondant aux racines xx 


Reprenons la relation (B.5) de l’annexe B dans laquelle nous explicitons le coefficient K. Nous 
avons : 


K = —(n!}? 
car le rapport des coefficients de degré le plus élevé de deux polynômes consécutifs est égal à 
—1. Donc, 
- (n1)? 
Li (tr) Ln(zx) 


expression dans laquelle, rappelons-le, xx est une racine du polynôme de degré (n + 1). Si nous 
utilisons la relation de récurrence (9.3), on obtient : 


Hk = 


tL,1(tx) = —(n+ 1) Ln(tk), 
ce qui nous permet d'obtenir deux expressions plus simples : 


E (n!) £p o (n+)? | 
pee RON Fe 


8. Calcul numérique des poids H4 associés aux racines 


Les deux expressions que nous venons d'établir, très faciles à programmer, nous fournissent les 
valeurs numériques des H4 dont on donne un tableau 9.3, page 149. 

Sur le Web *), on trouvera le programme r_laguer.c qui permet de calculer les racines et 
les poids des polynômes de Laguerre. 


9. Calcul des intégrales du type I = f exp(—x)f(x)dx 
0 


Comme d'habitude on suppose que f(x) est une fonction régulière sur (0, œ0) et l’on approche 
l'intégrale au moyen de l’expression : 


J= S 


k=0 
9.1. Exemple 1 
On se propose de calculer la constante d’Euler y = 0,577 21566490 au moyen de l’expression 


suivante : 
7 1 1 
— d 
oa po sh 
0 


Les résultats trouvés sont indiqués dans le tableau 9.1, page suivante. 


* http://www.edpsciences.com/guiipin/ 
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Tableau 9.1. 
Nombre de points Constante d’Euler 
5 0,577 215 409 
6 0,577 215 316 
7 0,577 215 638 
8 0,577 215 683 
9 0,577 215671 
10 0,577 215 664 927 
11 0,577 215 664 244 


9.2. Exemple 2 


Il s’agit de calculer la fonction factorielle, et nous avons choisi : 
10! = 3 628 800. 


Compte tenu de l’expression intégrale de la fonction factorielle, nous savons : 
(ee 
.I= [ova dz = 10! 
0 


Puisque la fonction à intégrer est de degré 10, nous devons obtenir un résultat exact en 6 points 
(en négligeant les erreurs d’arrondi propagées par la machine. C’est ce que l’on se propose de 
vérifier. Les résultats obtenus sont donnés dans le tableau 9.2. 


Tableau 9.2. 
Nombre de points 10! 
4 3033 216 
5 3614400 
6 3 628 799,999 999 97 


9.3. Remarque importante 


On note une fois de plus que la méthode donne d’excellents résultats. Toutefois il convient de 
se méfier des intégrales du type : 
OO 
I = foa) cos mx dx = 
0 


1 
m? +1 


qu'il faut examiner soigneusement. En effet, si m est «assez grand », cos mg peut être assez 
mal représenté par un polynôme de Laguerre de degré peu élevé. D’autres cas bien sûr peuvent 
présenter des dangers analogues liés au nombre de points où la fonction s’annule. 
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10. Calcul de l'erreur commise lors de l’approximation 
Nous allons reprendre le calcul réalisé lors de l’étude de la méthode de Gauss-Legendre, seuls 


quelques points de détail différent. 


Soit à calculer : 


Supposons que f(x) soit continûment différentiable sur l'intervalle fondamental (0,00). Le 
développement de Taylor-MacLaurin à l’ordre (2n + 1) nous donne : 


g?+1 r?2r+2 


ft) = $(0) + AP) + SP Oea OO) + 


(n+2) 


expression dans laquelle x et £ appartiennent à l'intervalle (0, co). 
Calculons 7 en remplaçant f(x) par son développement, il faudra utiliser des expressions du 
type : 


Qon+2 = ovaa dz = (2n +2)! 
0 


L'exploitation directe de la formule d'intégration de Gauss-Laguerre donne : 


BR (2m)! a 
k=0 k=0 k=0 
TE aise (0) on à OO) Spy 2 
R Hiz CE Hz HE 
FT Gr 22 ps TA 


L'erreur E s'écrit : 
n 
E= rof: 5 San) + f'(0 h: - Soma) + f(9(0) (1- Z5 mat) 
k=0 k=0 0 
1 
a 2n+2) 2n+2 
+e ao(i-g EE ary DL | 


Si f(x) est un polynôme de degré (2n + 1), la dérivée de f(x) d'ordre (2n + 2) est nulle, et l’on 
a légalité : 


I=J: 
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Dans ce cas il n’y a pas d'erreur mathématique due à une approximation; on obtient en 
conséquence le système suivant : 


K=p 
XO Hear =, vf! 
KI 
X Hr? = 2! 
k=0 


= 
8 
a N 
3 
+ 
= 
II 


(2n +1)! 


Il est intéressant de constater que le système de (2n + 2) équations ainsi défini est constitué 
de (2n +2) équations non linéaires dans la mesure où l’on considère que les Hy et les xx sont les 
inconnues. En revanche, si l’on connaît les zp, alors, (n + 1) équations quelconques prises dans 
le système précédent constituent un système linéaire permettant de calculer les Hy. 

Toujours est-il que l'erreur prend la forme suivante : 


= |I- J| = (z) fi- a TJ! D h (9.6) 


en prenant soin de noter que : 


D rt A (2n +2)! 


Bien entendu, comme toutes les fois en pareil cas, on recherche une majoration la plus raisonnable 
possible de la fonction f(2"#2)(£) dans l'intervalle (—1, +1), en définitive, l'erreur s'exprime de 
la manière suivante : 


Ble) = Mae f1- Cr (9.7) 


où Mono = sup Fe (x)| pour x appartenant à (0, co). 

Dans la mesure où l’on peut obtenir une majoration raisonnable M:,,:2, E(x) donne l'erreur 
mathématique liée à la troncature de la série des polynômes de Laguerre. Viendront s'ajouter 
lors des calculs effectifs les inévitables erreurs d’arrondi propagées par l'exécution des opérations. 
Pour n = 12, on trouve : 


Ez = 3, 698 1077 M24. 
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Le tableau 9.3 donne les racines et les poids du polynôme de degré 12. Sur sur le Web ©) on 
trouve le fichier texte appelé laguerre.txt qui donne les poids et les racines des 12 premiers 
polynômes. 


Tableau 9.3. Racines et poids associés des polynômes de Laguerre. 


Degré Racines x Poids Hp 
0,611 757 484515 13 0,377 759 275 873 127 
0,115 722 117 358 02 0,264 731 371 055 443 
2,833 751 337 743 36 0,090 449 222 211 682 
1,512 610 269 776 45 0,244 082 011 319 895 
6,844 525 453 118 77 0,002 663 973 541 842 
4,599 227 639 418 09 0,020 102 381 154650 
12 13,006 054 993 319 3 0,000 008 365 055 857 
9,621 316 842 445 915 0,000 203 231 592 668 
22,151 090 379 373 0,000 000 001 342 391 
17,116 855 187 466 0,000 000 166 849 388 
37,099 121 044 461 0,000 000 000 000 001 
8,487 967 251 005 0,000 000 000 003 062 


11. Fonction génératrice des polynômes de Laguerre 


Nous admettrons le résultat suivant sans démonstration : 
s(a) = Lolx) + tLi(x) + Lolz) ++ EL, (x) +. 


12. Calcul numérique de la transformée de Laplace 


F(p) la transformée de Laplace de la fonction h(t) est une équation fonctionnelle qui s'écrit : 
Fæ) = f hO exp pr) dt, 
0 


expression dans laquelle ¢ est une variable réelle (généralement le temps) et p une variable 
complexe. Sans entrer dans les détails de la théorie, les calculs sont réalisables si l'intégrale est 
convergente. Sous réserve de cette convergence, on peut être amené à calculer numériquement 
F(p). En effectuant le changement de variable y = pt, on obtient l’expression : 


DO 


F(p) = : | h(y/p) exp(—y) dy 


0 


*http://www.edpsciences.com/guilpin/ 


149 


MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ 


qui se calcule évidemment par la méthode de Gauss-Laguerre. D'un point de vue pratique, les 
calculs ne sont pas toujours aussi simples, notamment si la fonction h(y/p) a à peu près l'allure 
d’un pic entre zéro et Ærmin (Zmin est la plus petite racine de L, (x) polynôme de Laguerre de 
degré n servant à l'intégration numérique). Bien entendu, plus le degré n est élevé, plus £min 
tend vers zéro et meilleure est la précision du calcul. Malheureusement, en calcul usuel, il est 
difficile de dépasser le degré 12 ou 13. Nous n’allons pas renoncer pour autant à utiliser cette 
technique. Il suffit de couper judicieusement l'intervalle (0,00) en deux de la façon suivante : 


F(p) = 5 J h(y/p) exp(—y) dy += J h(y/p) exp(—y) dy 
0 a 


a étant déterminé par des considérations sur la fonction h(y/p). La première intégrale se calcule 
par la méthode de Gauss-Legendre, la méthode de Simpson etc., tandis que la seconde intégrale 
se calcule par la méthode de Gauss-Laguerre en posant z = y — a, soit : 


00 


z f hlu/p) expl) dy = > J h[(z + a)/plexp(—2)d2. 


a 


L'intérêt est évident dans la mesure où l’on a une très bonne estimation de la queue de la 
fonction. 


13. Appendice : Les polynômes de Laguerre généralisés 


Les polynômes de Laguerre sont susceptibles d’être étendus en écrivant une formule de définition 
plus générale : 


L$) = expla) -E [exp(-)a"te] (9.8) 


avec toutefois une restriction concernant le paramètre œ, il faut que sa partie réelle soit plus 
grande que —1. 


13.1. Relation de récurrence entre trois polynômes consécutifs 
Partant de la relation de définition (9.8), écrite pour le polynôme L% (£), on obtient : 


a x d+1 
Li(x) = exp(x) (n+ 1)! dgr+! [exp x) 


gree 


expression qui peut s’écrire sous la forme : 


gra- dr 


(n+1)L},,(x) = exp(x) n dar 


[exp(—-x}r"*%(n+a+1-x)] 
ce qui nous donne : 


(n+1)Lih(x) = (n +a + 1)Lp (2). 
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En utilisant la relation de Leibnitz, on peut transformer la dernière expression : 


—a+1 d?” 
7 [exp(-x)x 
dz” 


-ir pl -a)e" +a] = expla) — eo 


Comme par ailleurs on peut écrire : 


x d”! 


LEE E [(n + a)exp(—z)z”?te-! — exp(—z) 


nLi(x) = nexp(x) 


puis, 


—Q n—1 


—nexp(x) lexp(—z)2"1 = nL(x) — (n + a) exp(—2) L71 (2); 


n! dg”-! 
on trouve en’définitive la relation de récurrence cherchée : 

(n+ 1L 41e) — (2n + 1+ à — z)nLé(x) + (n+ a)L®_1(2) = 0. (9.9) 
13.2. Relation de récurrence faisant intervenir les dérivées 


Dérivons la relation de définition (9.8) : 


1 d” ue 
a Paa + ss £ ae ze 
LA) = lentes — ar 9 expo] lexp(-2)e" =°] + expla) r -Elt a) 
x exp(—x)r"t2 1 — exp(—x)x"+] 
On obtient alors : | 
Q x ® dq’ S 
[La (x) = -z Lale) +(n+a) exp(z)—r -zr [exp(—z)z”+e=1] 


Grâce à la formule de Leibnitz, nous allons transformer la dernière expression du membre de 
droite, ce qui donne : 


z° É n+a—1] _— IS 4 Sa n+a 
(n + a) exp(x) A de [exp(—x)x ]J=(n+a) exp(z) -r> T [exp(—x)x"*] 
T hiai a MF Viako EN 
n dxr-1 [exp( z)t s ] Li (x) x n-1(t) 


De là nous tirons une relation de récurrence faisant apparaître la dérivée d’un polynôme dont 
nous aurons besoin pour calculer les H, : 


[Lal] = nezle) — (n+ a)l- le). (9.10) 


13.3. Orthogonalité des polynômes de Laguerre généralisés 


Il s’agit de calculer l'expression : 


OO 


J = EO) [Lh (x)| dz 


j i exp(-2)27* -Č [exp(-r)x"+?] i lexp(—x)a "1 dz. 
0 
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En intégrant par parties d’une façon analogue à celle que nous avons envisagée lors de l'étude 
des polynômes de Laguerre, on obtient J = 0 pour n £ m. 
Reste à calculer la norme : 


oO 


I= [oa dz = Do iz 


ce qui donne : 
I=nT(a+n+1) 


expression dans laquelle T (u) est la fonction factorielle : 
T(u) = foo dt. 
0 


13.4. Calcul des racines de L® et des poids associés Hk 


On ne peut pas dresser une table des racines et des poids associés puisque ces valeurs dépendent 
du paramètre œ. Dans chaque cas particulier que l’on sera amené à considérer, il faudra construire 
la chaîne de calculs déjà réalisée pour les cas précédemment étudiés. 


13.5. Technique de calcul des intégrales du type I = f exp(—x}x*f(x)dx 
0 


Bien entendu, f(x) est une fonction régulière sur (0,00), et l'approximation s’effectue comme 
toujours au moyen de la relation : 


n 
1=N Hf (2), 
k=0 
expression dans laquelle les x; sont les zéros du polynôme de Laguerre généralisé L% (x) de 
degré (n + 1). 
13.6. Une autre relation de récurrence 


On peut avantageusement utiliser une relation de récurrence portant sur les L(x) pour 
calculer les poids H}. En effet, on établit que : 


n+a 
£ 


ie = i + A a 


Si +4 est une racine de L2 (x), on simplifie l'expression précédente : 
n 


FAR STE 
[LRE] = LE (an). 


Nous obtenons ainsi une forme aisée à calculer pour les Hp où nous n’avons plus à exprimer 
formellement la dérivée. 


152 


10 | Les polynômes d'Hermite. 
La méthode d'intégration 
de Gauss-Hermite 


Ce sont des polynômes orthogonaux relativement à la fonction poids gaussienne et sur l'intervalle 
(—co, +00). Nous allons en effectuer une étude en tout point semblable à celle des polynômes de 
Laguerre. Pour des raisons qui apparaîtront un peu plus loin, le polynôme d’'Hermite (1822-1901) 
de degré n est défini par la relation : 


K,(x) = (—-1)" exp{r?/2) € exp (—x°/2). (10.1) 


1. Relation de récurrence entre trois polynômes consécutifs 


Pour obtenir la relation désirée, il nous suffit de développer l'expression de K,,:1(x), soit : 


141 


Kasa (2) = (1) exp(2?/2) -= 


[z exp (~z? /2)] 
à laquelle on applique la formule de Leibnitz : 


q”: 


dx?-1 


(a) = 2 S(e) + 


< f(e) 


ce qui nous permet d'écrire : 


(DH Kusa) = expla?/2) ( w- exp (-2?/2) -n-o ( #2). 


On en déduit immédiatement : 
(1) H Kny (2) = —(~1) £ Kn (2) ~ (D nEn- (2) 
soit encore : 


Khu(x) = zKn(x) —-nKn-1(x). (10.2) 
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2. Relation de récurrence entre polynômes et dérivées 


Dans le même esprit que précédemment, nous allons établir une relation de récurrence simple 
entre les polynômes et les dérivées à seule fin d’obtenir une expression de Hp aisément calculable. 
Pour ce faire nous dérivons la relation de définition et nous obtenons : 


Ki (æ) = (-1)" expla? /2)- exp (22/2) + (-1)" exp(a?/2) À [-mexp (-2°/2)], 


ce qui donne grâce à la formule de Leibnitz : 


K! (£) = nKh-1(x). (10.3) 


3. Les premiers polynômes d’Hermite 


Puisque nous bénéficions de la relation de récurrence (10.2), il suffit en réalité de connaître les 
deux premiers polynômes d’Hermite pour déterminer tous les autres. Nous obtenons : 


Ko(x) = 1 

Ki(x) = x 

Kolæ) = x? —1 
Ka(x) = 2° — 3x 
Ka(x) = 74 — 6z? +3 


et ainsi de suite. 


4. Calcul des coefficients des premiers polynômes d’Hermite 


On trouvera sur le Web®) le programme hermite.c destiné à calculer les coefficients des 
polynômes d’Hermite dans le but plus précis de calculer leurs racines. 


5. Orthogonalité des polynômes d’'Hermite 


Les polynômes d’Hermite sont orthogonaux relativement à la fonction poids exp (—x?/2) et à 
l'intervalle (—o0, +00). C’est ce que nous allons montrer en calculant l'intégrale Ing. Sans nuire 
à la généralité, on peut supposer que k >n : 


+00 
pre f exp (-1?/2) K,(x)Kk(x) dz, 
soit encore : 
+00 
d” q¥ 
Ink = (~1)° tF J exp(z?/2) I exp (—-x OF r P ( z?’ /2) dx 


*http://wuw.edpsciences.com/guilpin/ 
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Effectuons une intégration par parties en posant : 


dv = Le exp (—x°/2) dx 
drk 
soit 
qk? 
v= dz exp (—x?/2) 
et 
2 q” 2 
u = exp(x/2) dun P (—x°/2) 


soit, après transformation donnée par la formule de Leibnitz : 


nil 


du = —-nexp(x?/2) i exp (—z?/2) 


dgr?! 


Dans le cas où n Æ k, le produit u.v est nul sur l'intervalle (—co, +00) car il contient 
exp (—z?/2) en facteur. On peut alors écrire : 


Ink = In-ik-1 


et de proche en proche on obtient : 


drk-" 
Or 
+00 gh-n 
f durer P (—2?/2) dr=0 quand k#n. 


Donc les polynômes d'Hermite sont orthogonaux. On en déduit immédiatement que les zéros 
d’un polynôme d'Hermite de degré n sont distincts, réels et répartis sur l'intervalle (—co, +00). 

Il nous reste à présent à calculer la norme d’un polynôme, il suffit de faire n — k dans 
l'expression de Ink : 


+00 
Tan: Sdin f exp (—-x°/2) dx = n!lV2r. 
—00 


6. Calcul des racines des premiers polynômes d'Hermite 


On trouvera un tableau 10.2, page 162, donnant les racines du polynôme d’Hermite de degré 12 
que nous avons calculées en double précision. 

Sur le Web C) on donne le programme r_hermit.c qui calcule les racines et les poids des 
polynômes d'Hermite. 


*http://wuw.edpsciences.com/guilpin/ 
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7. Calcul des poids H4 correspondant aux racines xx 


Rappelons tout d'abord que ce calcul est effectué dans l'hypothèse où les racines xx sont les 
(n + 1) zéros du polynôme de degré (n + 1}. La relation (B.5) de l'annexe B s'écrit alors : 


K 
Kirk) Kn(tk) 


expression dans laquelle on aura soin de ne pas confondre la constante K avec un quelconque 
polynôme d'Hermite. On trouve que la constante K vaut n!/27. 

Grâce à la relation (10.3), on obtient diverses expressions de A} aisées à calculer, soit : 

H n! y 2r (n +1)!V2r n! y 2T 
k = = pree 
Kppaltk) Kalte) [Kn (2k)? (nm +1) [Kn(xx)P 

En exploitant une de ces relations, on calcule numériquement sans difficultés les poids H4 
associés aux racines zk. On trouvera dans le tableau 10.2, page 162 les valeurs numériques de 
ces poids en face des racines correspondantes pour le polynôme de degré 12. 


H; = 


+00 
8. Technique de calcul des intégrales du type I= f exp (—x?/2) f(x)dx 


— O0 


où f(x) est une fonction régulière sur l'intervalle (—00,+o0). L’approximation se réalise au 
moyen de la somme : 


J =X Hyf (2k). 


k=0 


expression dans laquelle les x} sont les racines du polynôme de degré (n + 1). 


Exemple 


On se propose de calculer une intégrale dont on connaît la valeur numérique, soit : 


I= VE fes (—-x°/2) cos(x) dr = 1. 


Les résultats que nous avons obtenus sont donnés dans le tableau 10.1, page ci-contre. 
Remarque : On note qu’il n’y a pas de difficultés pour calculer les intégrales du type : 


+00 


= at) 


en effet, le changement de variable : 


nous permet de revenir au cas canonique que nous venons de traiter. 
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Tableau 10.1. 


Nombre de points Résultat 


0,999 222 
1,000 043 

0,999 998 143 
1,000 000 175 
1,000 000 097 
1,000 000 099 
12 1,000 000 099 


© D I Oo CR 


9. Autres notations très utiles 


Il arrive que des auteurs adoptent une définition légèrement différente pour les polynômes 
d'Hermite, soit : 
ý 2 
exp(—ax*), 
Le p( ) 


expression dans laquelle a est un nombre positif (il s’agit d’une formule analogue à celle de 
Rodriguès concernant les polynômes de Legendre). 
Dans ce cas, la relation de récurrence entre trois polynômes consécutifs s'écrit : 


KA (x, a) = (—1)"exp(az”) 


Ky (2,0) = 2axK}(x, a) — 2anK7_,(x,a). 
De même, la relation faisant intervenir les dérivées prend la forme : 
K% (2,a) = 2anK_1(x,0), 


et le carré scalaire de l'intégrale vaut alors : 


V2 


2 
En remarquant que : 


1 £ 
K* a 

va)" ” (o ) | 

on obtient les modifications à apporter aux expressions des racines et des poids des polynômes 

correspondants, à savoir : 


Kh(x) = 


Les fonctions Dž (x,a) = exp(—ax?/2)K#(x), encore appelées fonctions du cylindre parabo- 
lique ou fonctions de Weber-Hermite, constituent une base orthogonale de l'espace L? qui est 
[ee] 


l’espace des fonctions de carré sommable sur (—00, +00) ( f f(x)? dx). 
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La décomposition d’une fonction f(x) appartenant à L? sur (—o, +00) s'effectue en calculant 
les coefficients du développement de Fourier correspondant, soit : 


CO 


fæ) = X D} (z, a). 


k=0 


On multiplie les deux membres de cette dernière expression par D}, (x) puis on procède à 
l'intégration sur l'intervalle (—00, 00), on obtient : 


Je f(x (x, a) dr = JS 2o DiE) Dar, a) a) dz = Da J D% (x,a)D% (x,a) dx 


— 00 
OO 
= Yer i Ký (x) K (x) exp(—ax?) dx 
k=0 "o 
et compte tenu de l'orthogonalité, on trouve : 


Í f(x)D}, (x, a) dt = CmIm = ent 2 (2ay" 
et 
Cm = f(æ)D,, (x, a) dz 
m (a) a Je 


ainsi que 


Co = V2 J f(z)exp(—az?) dz 


On trouvera la démonstration de la convergence des intégrales €m ainsi que celle de la série 
associée à la fonction f(x) dans les ouvrages de Arsac et de Bass cités en bibliographie. 
Un cas particulier intéressant 


C’est le cas où a = 2r qui permet d'obtenir des résultats simples lorsque l’on est amené à 
travailler dans l’espace réciproque de Fourier (cf. chapitre 16). 
Nous écrivons : 


n 


dx” 


exp (—27z°), 


1/2 
Ki(x,27) = (-1)" (Zur) exp (272°) 


expression qui rend les polynômes orthonormés. 
En rappelant que la transformation de Fourier directe s'écrit : 


F(u) = I f(z) exp(2rjzu) dx, 
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soit : 
TF 
f(æ) —> F(u) 
avec une propriété importante : 


1 


p TF 
a f(x) — Grip 


FP) (u). 


Nous allons montrer que : 
Kž (x, 2r) exp(—7x?) 2 j” K3 (u, 2x) exp(—ru?). 


Si f(x) = x? exp(—rz?°) on obtient pour sa transformée de Fourier (cf. chapitre 16) : 


TE 1 d? 
(274)? du? 


x? exp(—rz?) exp(—ru’). 


Or, en faisant usage de la relation générale de définition des polynômes d’Hermite, on peut 
écrire : 

1 d? 

(2xj})? du? 


exp(—ru?) = P,(u) exp(—ru?) 


où P,(u) est un polynôme de degré p. Comme tout polynôme d’Hermite peut se développer de 
la façon suivante : 


K} (z, 27) = D apt?, 
p=6 


on en déduit que 
K* (x, 27) exp(—rx°) EE Qu(u) exp(—-ru?). 


Il s’agit maintenant de déterminer le polynôme Q,{u). La démonstration repose sur les 
propriétés des produits scalaires dans L?, et en particulier, de la relation suivante : 


(f(x), f(-x)) = (F(u), F(u)) 


dont on trouvera une démonstration dans le chapitre 16 concernant les transformées de Fourier. 
Comme la relation de définition permet d'écrire : 


K(x, 2r) = (—1)" K} (x, 27), 
on en déduit que : 


(Ki (2,27) exp(-rr’), Kj (x, 27) exp(—rz°)) 
= (1) fnm = (Qn(z, 27) exp( ~nz’), Qm(£, 27) exp(—-rx?)). 


À présent, changeons Q (x, 27) en (j)"R(x, 27), il vient : 


(Ra, 27) exp(—r7r?), Rn(x, 27) exp(—72*)) = nm, 
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on en déduit que : 
Rm(2, 27) = KP (Ex, 2), 
et que, par conséquent, on a : 
* 2) TF TX 2 
Kinz, 27) exp(—-7x*) —> j” K} (u, 27) exp(—ru?), 


l'ambiguïté du signe se trouve levée en examinant le terme de plus haute puissance (coefficient 
ap), mais on a déjà établi la relation suivante : 
d? 
- e 
(275)? duP 


apt? exp(—Tr?) TE ap xp(—ru?), 


ce qui permet de conclure que le signe à conserver est le signe plus. 


10. Calcul de l'erreur commise lors de l'approximation 


Nous allons reprendre le calcul réalisé lors de l'étude de la méthode de Gauss-Legendre, seuls 
quelques points de détails vont différer. 
Soit à calculer : 


+00 
I = J exp (—z°/2) f(x) dz 


Supposons que f(x) soit continûment différentiable sur l'intervalle fondamental (—00, +00). Le 
développement de Taylor-MacLaurinà l’ordre (2n + 2) nous donne : 


genti g2n+2 


FE) = AO + ŽO + O ++ em 0) + 


Cr+1 E P 


(2n + 2) 


expression dans laquelle x et £ appartiennent à l'intervalle (—00, +00). Calculons 7 en remplaçant 
f(x) par son développement, il faudra calculer des expressions du type : 


+00 +00 
Qon+2 = Î exp (—2°?/2) rt? dx = f exp (—x?/2) x? dg. 


“00 00 
On intègre par parties cette expression en posant : 

v =g tlg et du = exp (—z?/2) z dz 
ce qui donne : 


du = (2n + 1)z” dz et u = — exp (—z?/2). 


On peut écrire : 


+00 
Qon+2 = [- exp (-x°/2) £+] + (2n +1) o exp (—z°/2) z” dx, 


— 00 
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comme 
+oo 
J exp (—2°/2) dx = V2r, 


on trouve que : 
Qon+2 = (2n + 1)! V 2r. 
Par ailleurs Qon+1 étant une fonction impaire, Q2n+1 = 0. Revenons au calcul de T : 


ferae) 
(2n +2)! 


(2q)! 


L'exploitation directe de la formule d'intégration de Gauss-Hermite donne : 


z AUURS FEDEA A 22 
= Hp+... FRET RE EN HET 
J 10)» Re r 3 Rai +e.+ GT 2) > pI? 


T= Va | 0 pund rog US en +11] 


L'erreur E s'écrit : 


E=|1-J|= f(0) (v= = D) + F0) X Hizr + m (v= _ Hit) 
k=0 k=0 i k=0 


JODO) E ai p SO) T 
Tater UT oi RNA EE 


! 
(2n +2)! a 


Pang JQn + 2)(6) (ve +1)! — Soma) | 


Si f(x) est un polynôme de degré (2n + 1), la dérivée de f(x) d'ordre (2n + 2) est nulle, et l’on 
a légalité : 


Iæ. 


Dans ce cas il n’y a pas d'erreur mathématique due à une approximation; on obtient en 
conséquence le système suivant : 


5 Hk =N 2T 
k=0 
n 
X Hir = 0 
k=0 
n 
X Hesg = (2p — 1)! 2r 
k=0 
donc 
(2n+2) n: 
B- © (vrn +1)! SÙ maz?) | 


! 
(2n +2)! = 
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Bien entendu, comme toutes les fois en pareil cas, on recherche une majoration la plus 
raisonnable possible de la fonction f(2"+2)(£) dans l'intervalle (—1,+1), en définitive, l'erreur 
s’exprime de la manière suivante : 


= (ren + D! - 5 mar) 


k=0 


(10.4) 


où Mon+2 = Sup Fate) (x)| pour x appartenant à (—o00, +00). 


Dans la mesure où l’on peut obtenir une majoration raisonnable M,.2, E(x) donne l'erreur 
mathématique liée à la troncature de la série des polynômes de Laguerre. Viendront s'ajouter 
lors des calculs effectifs les inévitables erreurs d’arrondi propagées par l'exécution des opérations. 
Pour n = 12, on trouve : 


Ez = 1,935 10 Mo. 


Les poids et les racines du polynôme de degré 12 figurent sur le tableau 10.2, tandis que le fichier 
texte appelé hermite.txt que l’on trouvera sur le Web(*) donne les résultats concernant les 
douze premiers polynômes. 


Tableau 10.2. Racines et poids associés des premiers polynômes d’Hermite. 


Degré z£ H 
+0,444 403 001 944 139 0,806 292 983 509 187 
+1,340 375 197 151 62 0,368 391 758 069 477 
+2,259 464 451 000 80 0,072 984 713 184 739 
12 +3,223 709 828 770 10 0,005 523 056 331 147 
+4,271 825 847 932 28 0,000 121 250 244 966 
+5,500 901 704 467 74 0,000 000 375 975 985 


11. Fonction génératrice des polynômes d'Hermite 


Nous admettrons les résultats suivants sans démonstration : 


1 t t? t 
exp (a = 5) = Ko(x) + 16e) + 3 A:(x) TNT RE zE) w 
ou encore si l’on fait usage des fonctions du cylindre parabolique : 
z? t t t t” 
exp (= +at- 5) Do(x) + Pe) l z Pa(x) ERG Daa 


Dans le cas où l’on utilise la définition : 


K3 (z,a) = (—1)” exp(ax’) 
* http://www .edpsciences .com/guilpin/ 
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on obtient : 
at? * t * e * t” * 
exp | 2azt — z) = Kõ(xz,a) + FES (x,a) + 3 2 (æ,a)+-..+ 7 Kn(z, a) +. 


et en particulier si a = 27 : 


2rt? , ton P ., t oa 
exp Arat — —— = Ki (x, 27) + Ki (2,27) + Ke, 27) ++ Ka, 27) + 
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11 Calcul de quelques intégrales 
relevant des études 
précédentes au moyen d’un 
changement de variable 


Eu égard à la grande simplicité et à la grande précision de la méthode de Gauss généralisée, on 
est fortement tenté de passer en revue le plus grand nombre de polynômes orthogonaux dans le 
but évident de calculer le plus grand nombre d’intégrales présentant des singularités. 

Tout d’abord il nous faudra définir les polynômes orthogonaux relativement à la fonction 
poids w(x) sur l'intervalle fondamental fini ou infini (a, b), puis calculer leurs zéros x4 ainsi que 
les Hą associés. Comme trois polynômes consécutifs de la suite orthogonale obéissent à une 
relation de récurrence (cf. annexe B), on cherche à obtenir les coefficients de ladite relation de 
récurrence ; en règle générale, les deux premiers polynômes sont faciles à calculer. 

En désignant par W,(x) le polynôme de degré n de la suite orthogonale envisagée, on peut 
écrire une relation de la forme suivante : 


War) — [An (2) + Ba (2)|Wn (2) + Cn(2)Wn-1 (£) = 0. 


Ensuite, il faut être en mesure de calculer la norme d’un polynôme : 
b 


T= Jotowè(e) dz 

car cette quantité intervient dans le calcul des Hg. Bien que le champ d'investigation soit en 
principe infini, il n’y a que peu d’issues conduisant à des expressions qui puissent être aisément 
traitées analytiquement et qui autorisent le calcul effectif des x et des Hp. D'une manière tout 
à fait générale, les polynômes susceptibles de déboucher sur des résultats pratiques relèvent 
de l'étude des polynômes hypergéométriques encore appelés polynômes de Jacobi. Nous allons 
passer en revue un certain nombre de cas typiques dont l’étude se ramène aux cas précédemment 
abordés. 


1 
1. Intégrale de la forme : 1 = f -dx 
0 


Il s’agit donc d'étudier les polynômes V, (x) orthogonaux relativement à la fonction poids w(x) = 


=) sur l'intervalle fondamental (0,1). Soit : 


1 
2o i avec m Æ k. 
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Le changement de variable y = y1 — x, soit x = 1—y?, nous permet de transformer l'intégrale 
de la façon suivante : 


1 
faa = y?) Ve(1 — y?) dy = 0. 
0 


Remarquons que l’on peut étendre l'intégrale à l'intervalle (—1, +1) puisque l'élément différentiel 
est une fonction paire, d’où : 


+1 
f Va(1 — y?) Ve(1 — 4?) dy = 0. 


—i 


La suite des polynômes V,(x), lesquels sont des polynômes pairs, n’est rien d'autre que la 
suite des polynômes de Legendre d’indice pair. En effet, il suffit de se reporter à la formule 
de Rodriguëès pour vérifier que les polynômes de Legendre d’indice pair sont pairs et que les 
polynômes de Legendre d'indice impairs sont impairs. Il s'ensuit que l’on peut écrire que : 


Vai (1 — x?) = Pan42(£) = Vn (y), 
et que les racines y; sont données par l'expression : 
Yk =1- Tk 


T! convient de rappeler ici que les £ sont les zéros du polynôme de Legendre de degré (2n +2). 
Comme les racines des polynômes de Legendre sont opposées, on ne conserve que les xx positifs 
pour calculer les yg. 

Il nous reste à voir comment les H} associés aux £p doivent être calculés. Pour cela reprenons 
l'expression générale : 


dans laquelle on effectue le changement de variable : 
y=1-x, soit dy = —2x dx. 


En remarquant au préalable que : 


d d dy 1 
ag +) = r reele) r = Pitt) = n+ (9) 


l'expression de Hg devient : 


1 
ATk Vas (Y) ; 1 
Pon+2(tr) J Vl-Y Y—UK 


Cette dernière expression se transforme en utilisant l'identité : 


H} = 


RE DE 1 
ri Dre |E- Tk T+T 
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On obtient alors 
1 1 


H=- J aA f But) gy 


Pinrotte) T —Tk T+Tk 


Soit en définitive : 


+1 

2 Pon 

r E 
Pin+2(tx) i T — Tk 


où, n’hésitons pas à le répéter, les Hę sont les poids correspondant aux xk du polynôme de 
Legendre de degré (2n + 2). En résumé nous avons : 

Yk =l- Tk 

Hý = 2H%. 


1.1. Calcul numérique des y et des Hý des polynômes Vn (x) 


Il n’est pas très difficile de calculer ces grandeurs, et le tableau 11.1 donne les résultats du calcul 
pour le polynôme de degré 11. Sur le Web (=) on trouvera les résultats concernant les premiers 
polynômes dans le fichier texte vn_x.txt. 


Tableau 11.1. Zéros et poids correspondants des polynômes Va(x). 


Degré Yk Hpk 
0,995 136 433 756 837 0,278 503 745 711 265 
0,956 794 043 016 991 0,273 082 996 692 025 
0,883 079 894 390 853 0,262 347 009 574 158 
0,779 705 097 347 766 0,246 504 753 620 871 
0,654 678 756 166 416 0,225 864 592 161 418 
11 0,517 687 441 268 599 0,200 828 288 893 594 
0,379 344 680 233 946 0,171 883 212 409 773 


1.2. Technique d'intégration 


0,250 368 580 202 265 
0,140 751 142 618 251 
0,058 982 630 398 875 
0,011 378 277 344 275 


0,139 592 936 925 331 
0,104 586 670 228 415 
0,067 549 803 115 903 
0,029 255 990 740 224 


On utilise toujours la même relation pour effectuer une approximation de la valeur de Z, soit : 


J = Ņ_ Hif (vk). 


k=0 


* http://www .edpsciences .com/guilpin/ 
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On peut également calculer les intégrales du type : 
f Fæ) 
z 
I= | ~= dr 
| Vb—x 


qui se ramène au cas précédent au moyen du changement de variable : 


T—aQ 


b-a 


y = 


ce qui nous permet d'écrire : 


es a [IE 0e da 


Il suffit à présent de poser y% = a+(b—a)yx pour obtenir la forme désirée, J est alors approchée 
par l'expression : 


J= Va ÿ Hifk). 


k=0 
1.3. Un exemple d'intégration 


On se propose de calculer : 


dz = 4/3 = 1,333 333 333 333 333. 


1 
I= f x 
yl= x 
0 
Les résultats que nous avons obtenus sont donnés dans le tableau 11.2. 


Tableau 11.2. 


Nombre de points Résultat 
2 1,333 333 333 333 333 
3 1,333 333 333 333 333 
4 1,333 333 333 333 333 
5 1,333 333 333 333 331 
6 1,333 333 333 032 


On vérifie que, puisque f(x) est un polynôme du premier degré, les résultats doivent être 
rigoureux à partir de n = 2. Cependant, nous avons tenu à donner les autres résultats pour 
montrer que la précision se dégrade avec le nombre croissant de points car apparaissent les 
inévitables erreurs de troncature qui affectent la précision des racines et des poids associés ainsi 
que la précision de la somme. 
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1 
2. Intégrale de la forme I = f f(x) V1 — xdx 
0 


Il va de soi que nous allons nous intéresser aux polynômes orthogonaux U, (x) relativement à la 
fonction de base w(x) = V1 — x ct l'intervalle (0,1), soit : 


1 
J ove -gzdr=0 avec m Æ k. 
0 


Le changement de variable y = VI — x, soit £ = 1 — y?, nous permet d'écrire : 
1 
Ja —p)U(1-y)dr=0 ave m£k. 
0 
Comme l'élément différentiel est une fonction paire, on en conclut que : 


+1 
fva -y )Uk(1 -y )dr=0 avec m £k. 


+ 


Par conséquent les polynômes yU,(1 — y?) sont des polynômes impairs orthogonaux sur 
l'intervalle (0,1) relativement à la fonction de base w(x) = V1 — x. Il s’agit là des polynômes 
de Legendre de degré impair qui sont de surcroît impairs. Donc : 


zUn (1 aa z’) z Pon+2(x) 


de là on déduit que : 


Ua(x) = = Pa 1x). 


On calculera les racines yp de Uzn+1(y) à partir des racines du polynôme de degré (2n + 1). 
Remarquons que les polynômes de Legendre de degré impair possèdent toujours une racine 
nulle et 2n racines réelles opposées, donc pour obtenir les yx il suffit de poser : 


Yk = 1-x$. 


La racine nulle de P»+3(æ) correspond à la racine nulle évidente du polynôme yUn+1(1 — y°). 
À présent, calculons les H% correspondant aux yp : 


H= j Un+1(y)VT — y i 
k — 
us Y — Yk 


Le changement de variable x = y1 — y transforme cette expression en : 


1 

2 Unyi (1 — 2°)? 

Hg = 7 2 J aA a dy. 
Usa rk) J T— Tk 
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En notant que : 


—2%? 
Un (9) = P; i) 
n+ 


et que 


z 1 1 i 1 
a — q? 2 |z-zrk a+) 


on aboutit finalement à une expression simple de HX : 


+1 
27? P 
pi = TE J ensa (2) dx = 2Ha}. 
Pin+3(te) A T— Tk 


Rappelons que les x4 et les Hg sont les zéros et les poids associés du polynôme de Legendre 
de degré (2n + 3). En définitive, nous avons : 


y = 1% 


H% = 2H, x} 


2.1. Calcul numérique des yk et des H¥ des polynômes U, (y) 


On a reporté sur le tableau 11.3 les résultats obtenus pour le polynôme de degré 11, résultats 
directement déduits de l’étude des polynômes de Legendre. Sur le Web C), on trouvera les 
résultats concernant les premiers polynômes dans le fichier texte un_x.txt. 


Tableau 11.3. Les zéros et les poids correspondants des polynômes Un (x). 


Degré Uk He 
0,982 242 618 777 886 0,004 704 357 862 335 
0,930 232 342 038 332 0,017 986 900 669 840 
0,847 665 099 712 485 0,037 489 339 976 674 
0,740 408 244 072 688 0,059 704 359 522 125 
0,616 083 601 856 242 0,080 539 587 896 191 
11 0,483 525 845 139 551 0,095 977 183 512 452 
0,352 154 660 959 083 0,102 724 186 114 703 
0,231 305 302 178 075 0,098 750 243 709 796 
0,010 433 970 271 955 0,026 543 841 354 487 
0,054 161 141 423 958 0,058 619 320 141 303 
0,129 564 951 355 262 0,083 627 346 047 326 


* http://wuww.edpsciences.com/guilpin/ 
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2.2. Technique d'intégration 


On approche l’intégrale par la même formule, à savoir : 


tandis que l'intégrale : 


s'approche par l'expression : 
nm 
J = (b — a)??? $ HE fluk). 
k=0 


où les valeurs y% sont données par la relation : 
Yk =a + (b — a)yr. 


Ce dernier résultat est obtenu d’une manière tout à fait identique à celui établi dans le dernier 
paragraphe à cette différence près que l’on effectue le changement de variable y = a + (b — a)æ 
dans l'intégrale donnant HŸ. 


2.3. Un exemple d'intégration 
Nous nous proposons de calculer : 


T(4)r(3/2) 


© = 0,101 587 301 587 3015 
T (11/2) | 7 301 58 i 


1 
1= fes Vi-s ds = 
0 


où P(x) est la fonction factorielle. 
On donne dans le tableau 11.4 les valeurs trouvées. 


Tableau 11.4. 


Nombre de points Résultat 
2 0,101 587 301 587 3015 
3 0,101 587 301 587 3015 
4 0,101 587 301 587 3013 
5 0,101 587 301 587 301 2 
6 0,101 587 301 587 301 0 


Bien entendu, comme f(x) est un polynôme de degré 3, nous devons trouver un résultat exact 
à partir de deux points. Ici encore, nous avons voulu montrer l'influence des troncatures et des 
arrondis sur les calculs. 
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+1 
3. Intégrales de la forme 1 = f v1 — x2dx 
= 


Sans entrer dans les détails, disons que l’étude des polynômes R, (x) orthogonaux relativement 
à la fonction poids w(x) = v1 — x? et à l'intervalle (—1, +1) relève directement de l'étude des 
polynômes de Tchebycheff. Les zéros de R:,1(x) sont donnés par : 


z k+1 
= cos | — 
k Fee 


tandis que les H correspondants sont donnés par : 


T k+1 
H* = 2 2 
i= Zsh (=) 


3.1. Calcul numérique des x, et des Hë des polynômes Rn (x) 


Dans le tableau 11.5 on a reporté les valeurs numériques calculées pour le polynôme de degré 
11. Sur le Web (=), on trouvera les résultats concernant les premiers polynômes dans le fichier 
texte rn_x.txt. 


Tableau 11.5. Les zéros et les poids correspondants des polynômes Ra(x). 


Degré Yk Hk 
+0,965 925 826 289 068 0,017 537 233 634 936 
+0,866 025 403 784 439 0,065 449 846 949 787 
11 0,707 106 781 186 548 0,130 899 693 899 575 
+0,500 000 000 000 000 0,196 349 540 849 362 
+0,258 819 045 102 521 0,244 262 154 164 213 
0,0 0,261 799 387 799 149 


3.2. Technique d'intégration 


L'intégrale I est bien entendu approchée par l'expression devenue classique : 
n 
J=} _ Hifl). 
k=0 


Il est intéressant de noter que les intégrales de la forme : 


b 


aa (za) x) de 


a 


* http://www .edpsciences .com/guilpin/ 
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se ramènent au cas précédemment étudié à condition de faire usage du changement de variable 
suivant : 


dE 
Cette dernière intégrale est alors approchée par : 
n 
TS HOR): 
k=0 
3.3. Un exemple numérique 


Soit à calculer : 


+1 


tof aiem dx -0. 


= 


Sur le tableau 11.6, nous avons porté les valeurs approchées. On vérifie que les erreurs sont 
de l’ordre de 10716, et qu'elles ne sont dues qu’à l'exécution des calculs. 


Tableau 11.6. 


Nombre de points Résultats 
3 0,166 10715 
4 0,971 10-16 
5 0,277 1076 
6 0,555 10718 
7 0,598 10716 


+1 
4. intégrales de la forme I = f f(x), /1%zdx 
0 


Ici encore l'étude des polynômes S,(x) orthogonaux relativement à la fonction poids w(x) = 
T 


-2 et à l'intervalle (—1, +1) relève directement de l'étude des polynômes de Tchebycheff. Les 


LS 
zéros de S, (x) s'expriment au moyen de la relation : 


2k+1 
Tk = C08? = tr) avec k =0,1,2,...,n. 
n 


et les Hý par la relation : 


MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ 


4.1. Calcul numérique des xx et des H des polynômes S, (x) 


On trouvera sur le tableau 11.7 les valeurs numériques correspondant au polynôme de degré 11. 
Sur le Web @), on trouvera les résultats concernant les premiers polynômes dans le fichier texte 
sn_x.txt. 


Tableau 11.7. Les zéros et les poids associés des polynômes Sn (x). 


Degré Yk Hk 
0,995 342 973 018 165 0,271 909 754 072 704 
0,958 605 650 752 726 0,261 873 780 008 211 
0,887 855 645 352 210 0,242 546 154 164 063 
0,788 340 161 057 434 0,215 360 318 131 115 
0,667 439 806 085 493 0,182 332 521 001 007 
11 0,534 121 206 682 336 0,145 912 283 394 760 
0,398 271 993 473 683 0,108 800 727 724 129 
0,269 967 481 134 424 0,073 750 248 299 135 
0,158 723 428 390 673 0,043 360 378 833 454 
0,072 790 297 726 756 0,019 884 996 920 956 
0,018 541 356 326 101 0,005 065 164 245 362 


4.2. Technique d'intégration 
L'intégrale J est toujours approchée par l'expression : 
N 
J = Hi f(xx) 
k=0 


Il est intéressant de noter que les intégrales de la forme : 


b 
B (x — a) 
r= re dx 


se ramènent au cas précédemment étudié en faisant usage du changement de variable : z = 
a + (b — a)y ce qui permet d'approcher l'intégrale au moyen de l'expression : 


J=(b-a)J_ Hif la+ (b- ax]. 
k=0 


soit encore : 


_ 2m(b—a) 


= a] Aa heal: 


* http://www.edpsciences .com/guilpin/ 
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4.3. Un exemple numérique 


Soit à calculer : 


+1 | 
1= y Pis 
l1-x 
= 


Il s’agit d'intégrer un polynôme de degré zéro. Les résultats trouvés sont donnés dans le 
tableau 11.8. Ici encore les erreurs ne sont dues qu’à l'exécution des calculs, et l’on note que les 
deux derniers chiffres significatifs sont faux. 


Tableau 11.8. 


Nombre de points Résultats 
3 3,141 592 653 589 792 
4 3,141 592 653 589 791 
5 3,141 592 653 589 791 
6 3,141 592 653 589 791 


5. Éléments de bibliographie 


M. CROUZEIX et A.L. MIGNOT (1984) Analyse numérique des équations différentielles, Éditions 
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12 | Les polynômes de Bernoulli, 
formule d’Euler-MacLaurin. 
Méthode de Romberg et autres 
techniques d'intégration 


1. Formule d'Euler-MacLaurin 


Les polynômes et les nombres de Bernoulli (Jacques Bernoulli 1654-1705) jouent un rôle 
important en analyse mathématique. Ces éléments sont à la base d’une technique d'intégration 
numérique obtenue à partir de la formule d’'Euler-MacLaurin, laquelle sert ensuite de tremplin 
à la méthode de Romberg. Au passage nous verrons une application des nombres de Bernoulli 
au calcul de la constante d'Euler. 

Ces polyômes de Bernoulli possèdent une autre propriété concernant les séries de Fourier : 
on peut considérer les fonctions périodiques de période 1 représentées sur une période par les 
polynômes de Bernoulli de degré q et noté B,(x). Le coefficient de rang n de ce développement 
(an où bn selon la parité) est en 1/n2. Cette propriété relie aussi de près ces polynômes à 
la fonction dzeta de Riemann (1826-1866), et plus spécifiquement les nombres de Bernoulli. 
En outre, cela signifie que les fonctions périodiques qui sont définies sur une période par les 
polynômes de Bernoulli, non seulement sont continues, mais ont toutes leurs dérivées continues 
partout. Notamment, aux extrémités de l’intervalle (0, 1), les fonctions sont continues à dérivées 
continues, bien entendu, nous ne nous intéressons qu'aux dérivées non nulles. 


1.1. Fonction génératrice des polynômes de Bernoulli 


Les polynômes de Bernoulli sont les coefficients du développement de l’expression suivante : 


ne = 2 £B, (2). (12.1) 
Par dérivation de la formule (12.1), on montre que : 
B(x) = kBx-1(x), (12.2) 
et par identification directe, on voit que : 
Bo(x) = 1. (12.3) 


En utilisant l'identité : 
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puis la relation de définition (12.1), on déduit alors l’expression suivante : 
B,(1 — x) = (-1)*B{(x) (12.4) 
ce qui permet d'écrire : 
Be (1) = (—1)* B} (0). 


En intégrant la relation (12.1) par rapport à x, on établit que : 


1 
IEC dæ =0 pour k >Q. 
0 


On obtient alors : 


B(x) = 1, 
1 
Bı (zx) =r 2? 
B(x) = z? — £ + 5 
Ba(x) = 2° — =r? + = 


1.2. Les nombres de Bernoulli 
Par définition, les nombres de Bernoulli sont donnés par l’expression : 
By = Bk(0). 


En faisant x = 0 dans la formule (12.1) pour obtenir les nombres de Bernoulli, on voit que la 
fonction : 
u u u 


+5 = coth= 
exp(u) —1 2 2 2 


est une fonction paire. On déduit alors que : 


1 
Bı — 729 
et 
Bom+1 = 0 avec m2>1. 
Il s’ensuit que les nombres de Bernoulli de rang impair — hormis le premier — sont nuls 


et que seuls diffèrent de zéro les nombres de Bernoulli de rang pair. Voici donc les premiers 


178 


12. LES POLYNÔMES DE BERNOULLI, FORMULE D'EULER-MACLAURIN 


nombres de Bernoulli non nuls : 


1 
Bo = 1 Bı = 72 
1 1 
B = — — — — 
2 6 Bı 30 
1 1 
B = 5 Be z 
5 691 
Bo = — Bo = -—— 
10 66 12 2730 
7 3617 
Bu = 6 Bie 510 
p, — 43867 __ 124611 
18 = 798 2007 330 
p, — 854513 236364091 
22 138 24 2730 


1.3. Expression des polynômes de Bernoulli en fonction des nombres 
de Bernoulli 


Pour x = 0, l'expression (12.1) nous donne : 


u u u u 
—  =1+Bu+B HB. He + Banm + 
exp{u) — 1 Fi 29] fa +72 (2n)! + 
il s'ensuit que : 
uexp(uz) u expluz) = (1+ ur | u?x? + ur? Jo utg" 4 
explu)—1  exp(u) —1 P E 1! 2! 3! k! 
u2 ut u?” 
1+ Biu + Bis + BaS r Hee t Bon Fe 
(2n)! 
X u” u? u" 
L'identification des termes en u donne : 
By(x) : zë gE! gE? Bə N gET4 Ba F rE Be 
k! k! (k—1))  (k—2) 2 (k—4) 4 (k—6)! 6! 
Bg- 
+ i D si k est impair, 
B 
+ ZE si k est pair. 


De là nous tirons l'expression générale : 


Ba) = zë + af 1B; + 2% 2C2Bs + af AC Ba +. 
-+xBxj1 si k est impair, 
-+ Bk si k est pair. 
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1.4. La formule d'Euler-Maclaurin dite formule de la somme 


Il s’agit d’une méthode d'intégration qui utilise les nombres de Bernoulli; pour l'obtenir, nous 
allons intégrer successivement par parties l'expression suivante : 


h 
FAN SES fre d= fFer- dé. 


On aboutit alors à la formule usuelle : 


h2 
— [2 1 
F(s +h) - F(z) =hF (2) + SF (£z) ++ 
h 
es [remeinr-9 dt. (12.5) 
J (2p)! 


Maintenant, nous allons appliquer la relation (12.5) aux dérivées successives de F(x), en nous 
arrêtant toutefois au même ordre à chaque fois. Nous obtenons les formules suivantes : 


h? 
1 p — h2 p" pired (2p) 
REF" (a + h) — F'(x)] = h F” (x) Üp- DE (x) 
h 
(2p+1) fi h t ie dt 12 6 
0 
h2P 
RCE (æ +h) — F” (x)| = RÉF (£) ++ = (0) 
h 
2 PR h-t a dt, (12.7 
+h f (t+h— ap = , 7) 
0 
2 
hE [FO de h) — F™ (x)| = hETI FEHI (q) re RE pEr)(7) 
(2p— k)! 
h 
efre tD (w+ h — t) 4 (12.8) 
h spe l ai 02 
i i Gp F]! 
0 


On poursuit le calcul jusqu’à l’ordre (2p — 1), soit : 
k 
he LÉ (x +h)- paraa] = hP FCP) (x) + h?! | FOPHD (x + h—t)t dt. (12.9) 
0 


À présent, nous allons multiplier l'égalité (12.5) par Bo, puis l'égalité (12.6) par B1/1! et ainsi 
de suite, c’est-à-dire légalité (12.8) par B4/k!. Additionnons toutes ces relations, puis, en se 
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souvenant que Bom+1 = 0, on obtient le coefficient de F(x) que l’on désignera par c : 


+ 


1 Bik  Bok(k—1) Bhk- 1)(k — 2) 
Ê t De T 3 


expression que l’on peut écrire sous la forme : 


1 ; 
C = FI (1+ CB + CRB: +- -+OP By t+) 


où G3 est le coefficient du binôme. En utilisant la relation (12.4) du paragraphe 1.1, nous 
remarquons que : 


c = B(1)— Bp (kest pair). 


On en déduit alors que c = 0. En définitive, il reste : 


F(z +h) — F(z) = —Bıh [F(z + h) + F'(2)] + Be [F" (æ +h) — F” (2)] 


-+ Ba—2 iy (FP-d(z+h) LT) 
F"(2p—2)! 


h 
2-1 


pet [ren de pi + Op} 


0 i 
Bop h?¥t2P-2k Bop-2h?P-? | i 


+ 


Op CHL T Qp — 22! grao) 


La dernière parenthèse s'exprime simplement en fonction du polynôme de Bernoulli de degré 
2p; pour cela on remarque que : 


gP Bop—2h?P? 2 h?P t h?P h?P t 
I top Da O e n) poire Gp 22 (n) P| 
(2p) (2p — 2) (2p) (2p) (2p) 


Si maintenant on pose F”(x) = f(x), nous obtenons une expression canonique qui prend alors 
la forme suivante : 


Bzh? 


DE [f(x + h) + F'(x)] 


J f) dt = -Bih [f(E + h) + f(2)] + 


ta in f reana [Bo G) - Ba dt. (12.11) 


Évaluation du reste — Le reste est donné par l'expression : 


h 


h2? fs 2P) (t+ h-t) [Bə ($) — Bal dt}, (12.12) 


(2p!) 
0 
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soit : 


h h 
h2? h2? t 
(2p) = (2p) = = 
2p) Ji (x+ h — t)Bəp dt| + E (£ +h — t)Bop G) dt|. 
0 


0 


E= 


Comme Bop et Bop (£) conservent chacun un signe constant, on peut appliquer à chacun des 
deux termes de cette relation la formule de la moyenne en trouvant un nombre 0 compris entre 
0 et 1 tel que : 


Le (2p) h) 2P) (E + 0h) A 4 d 
E= pl (x+0 JB + | AA ) f Ba (5) tl 
0 
h 


mais : J Ban dt=0 
0 


on obtient en définitive : 


h2r+1 
— (2p)! 


| G + h) || Bəpl. 


1.5. Application au calcul des intégrales simples 


Considérons un intervalle fini (a,b) divisé en n sous-intervalles de longueur identique h, 
autrement dit, on définit des points x; en progression arithmétique sur l'intervalle (a,b) tels 
que : 


To=a L=at+hk, x=a+2h, ..., x =a+nh=tb. 


Appliquons la relation (12.11) à chaque sous-intervalle puis effectuons la somme de toutes ces 
relations. En posant pour plus de clarté y; = f(a + kh) avec k = 1,2,...,n, nous obtenons : 


b 


2 
fro dr =h (ou +Y + Ye +... Yn- + ju) 15 Pah [F @) — f'a) 


2 2! 


Bh’ 
4! 


2p—2 
LAC) — Pa) + ++ EE [eo — F- a)] 


l’erreur étant majorée par 


Bolh2P+1 7 
Ke | É }! > 1x0). 
P): i=1 


Remarque : On reconnaît dans la première parenthèse du membre de droite l'expression de la 
formule des trapèzes que du reste on obtient rigoureusement en faisant p = 1 dans la dernière 
relation. 
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Application au calcul de la constante d'Euler — Par définition, la constante d’Euler (1707- 
1783) est donnée par l'expression : 


my 2 3 4 
Cette série ne converge pas très rapidement, aussi lui préfère-t-on un développement asympto- 
tique encore appelé série semi-convergente que l’on obtient de la façon suivante : dans l'expression 
précédente, on fait f(x) = log,(x), h = 1 et zı = m (entier positif quelconque). On obtient alors 
sans problème : 


p BUT om m? 120mi  252mô Ikm 


t 1.1 1 
y= lim CR 0) 


Retenons les treize premiers nombres de Bernoulli (non nuls), et calculons la somme pour 
m = 13 : alors, on obtient y avec quinze chiffres significatifs exacts en utilisant la représentation 
des nombres sur huit octets (16 chiffres significatifs). 


1.6. Application au modèle des chaleurs spécifiques selon Debye (1884-1966) 


En 1912, Debye a proposé un modèle de la chaleur spécifique des solides qui aboutit au résultat 
suivant (le modèle ainsi que l’utilisation des nombres de Bernoulli sont présentés dans l'ouvrage 
de Rocard cité en bibliographie) : 


T 
12 y3 3z 
v = 3R 
PA r3 Î exp{y) — 1 dy exp(x) — 1 
0 


où x = U/T (U est une constante dépendant uniquement de la nature du corps considéré, elle 
s’appelle température caractéristique). On se propose d'établir une table de la chaleur spécifique 
de largent pour lequel U = 215 K. On écrit les relations suivantes : 


=. Da B 0 
= — avec =0, 
exp(z)-1 fgn ý iii 
3 œ m+ 3 2 2n 
y y 2_ č y y 
eae Sae Ban = i B 
exp(y) — 1 2, RU Tg (2n) 


puis on calcule l'intégrale : 


r 3 œ n+3 3 4 © 22843 
Í r r a A A =Z- 2 
exp(y) — 1 = (n+3)n! 3 8 (2k + Den? 
J = 
on déduit que : 


Cy 3 = x? 3 X ogr 
ts de B | B 
3R ns D Gr +50) nos 82 D) di 


d’où 
2k 1— 2k 
1+3 
Gis -Rh(135 mag) 


Cette dernière expression a fait l’objet du programme argent .c qui est donné sur le Web (*). 


*http://www.edpsciences.com/guilpin/ 
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1.7. La méthode de Romberg 


b 
Quand on calcule une intégrale I = f f(x) dx par la méthode des trapèzes avec un pas hn = be, 


a 
on obtient la relation suivante : 


I = E (ro + f(b) + ` fla+ ss) 


k=1 
avec comme expression de l'erreur mathématique de troncature : 


3 
En = UD f avec a < zx <b. 
Si n tend vers linfini, la suite 1,, générée par la méthode des trapèzes, converge vers la valeur 
de l'intégrale. On peut alors songer à accélérer la procédure de convergence au moyen d’un des 
algorithmes présentés au chapitre 2, mais on peut aussi utiliser le fait que l'erreur est donnée 
par la formule d'Euler-MacLaurin en soulignant toutefois que la fonction f(x) doit être (2p +2) 
fois dérivable sur l'intervalle (a, b). Revenons à cette expression de l'erreur : 


h2P+2 fe RE t 
B=] (z+ hn- t) |B» (E) - Bam dt 
0 


et nous notons que cette erreur est un polynôme en h?. L'idée de la méthode de Romberg repose 
sur le calcul de Z, pour des valeurs différentes de hn, et de construire le polynôme d’interpolation 
de la variable hê passant par les I» puis de calculer la valeur de ce polynôme d'interpolation 
pour hn = 0. Il faut bien remarquer que la valeur obtenue de In pour en hn tendant vers zéro 
est une extrapolation du polynôme d’interpolation. 

Pour réaliser l’extrapolation, on aura recours à la procédure de Richardson généralisée 
— généralisation qui semble avoir été conçue à cet effet. Comme l'erreur est un polynôme en 


h?: on prendra : 


(x) = 


Malheureusement, si nous appliquons le procédé de Richardson à la suite des Jp, la condition 
assurant la convergence ne sera pas vérifiée car : 


lim 


=] quand n tend vers l'infini. 
hn+1 
Pour pallier cet inconvénient, et assurer la condition de convergence, on choisit la suite S; 
formée par les valeurs In. Autrement dit, on calculera les intégrales 7, par la méthode des 
trapèzes avec un pas donné par lexpression : 


b—a 


hon = on 


avec ho = b— a. 


On vérifie alors que l’on obtient : 


Tn ho gn+1 


Zn 2 ho 
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Reprenant l'expression de la méthode de Richardson généralisée et en posant : 


ho 


nous pouvons écrire : 


UP a A T EE 


PREL) e AE nR En PT et 
n (ho/2”)2 _ (ho/27+k+1)2 5 
ce qui s'écrit encore : 
k+1mUE) (k) 
T{*+1) 4 hi -Th . 
M aki23 
En résumé, on utilise les relations suivantes : 
b= 
ho = =; 
n 
Rn = A 
PAL 
b m 
SO = hn (28 + X Fla + ern) , avecm=2"—1. 
k=1 
1.8. Un exemple numérique 
On se propose de calculer l'intégrale suivante : 
f log, (1 + 2) 
og.(1 + x 1 2 
T = = = ={l 2}}° = 0,240 226 507 
JE ae = 3 Dog. (2)? = 0,240 226 
0 


1 
et de former la suite des 74 à partir de ho = z On obtient alors le tableau 12.1. 


Tableau 12.1. 


Suite initiale 


0,228 

0,240 066 6 
0,235 5 0,240 216 00 

0,240 206 6 0,240 226 03 

0,239 03 0,240 225 87 0,240 226 653 
0,240 224 6 0,240 226 651 

0,239 926 0,240 226 64 
0,240 226 5 

0,240 151 


L'erreur est E = 0,1410 $. L'epsilon-algorithme appliqué à la même suite donne le résultat 
suivant : 7 = 0,240 225 49 avec une erreur E = 0,1 1075. 
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Si la méthode de Romberg donne un résultat avec un ordre de grandeur meilleur que le 
résultat donné par la méthode de l’epsilon-algorithme, on obtient encore de meilleurs résultats 
avec beaucoup moins de calculs en utilisant la méthode de Gauss-Legendre dont voici les résultats 
en 4, 6 et 12 points. 


4 points T = 0,240 228 
6 points T = 0,240 226 509 
12 points Z = 0,240 226 507. 


Ces derniers calculs ont été réalisés avec une machine fonctionnant avec 10 chiffres significatifs. 


2. Autres méthodes d'intégration 


Si les méthodes fondées sur la technique de Gauss sont, d’une façon générale, les plus perfor- 
mantes, il existe un certain nombre d’algorithmes très simples qui méritent d’être présentés, ne 
serait-ce que pour la réflexion qu'ils suscitent. 

Il est bien entendu que l’on s'intéresse ici à l'intégration numérique des fonctions dont 
l'intégrale sur un intervalle fini (a,b) a un sens, d’ailleurs cette fonction peut être continue 
par morceaux avec des points de discontinuité de première espèce. Cela signifie que l’on effectue 
le calcul sur les différents morceaux selon une des méthodes que nous allons exposer, et que nous 
en ferons ensuite la somme. 

Une intégrale peut avoir un sens bien que la fonction à intégrer présente une apparence de 
discontinuité de seconde espèce : nous avons rencontré un exemple à propos de la méthode de 
Gauss généralisée : les singularités étaient alors contenues dans la fonction-poids aux bornes de 
l'intervalle fondamental. 

Quoi qu’il en soit, nous nous intéressons au calcul de : 


r= f ro dx 


où a et b sont des nombres finis et f(x) une fonction continue possédant des dérivées jusqu’à 
l’ordre nécessaire pour le besoin des calculs d'erreur. 


2.1. La méthode des rectangles 


L’intervalle sur lequel s'effectue l'intégration est divisé en N sous-intervalles de longueur égale 
h = (b—a)/N ce qui nous définit une suite d’abscisses z; en progression arithmétique. La valeur 
de l’intégrale entre deux points consécutifs x; et £i+ı notée s; est approchée par s; : 


s; = hf (x1); 


la sommation des s; fournit une approximation de l'intégrale J. Désignons par T’ l'approximation 
obtenue : 
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Estimation de l'erreur mathématique — L’erreur due à l’approximation mathématique s'écrit : 
E=]|I-T']|. 
Désignons par F(u) la primitive de la fonction f(x). Nous pouvons écrire : 
si = F(ziz1) — F(xi); 
puis : 
E; = si — $; = Fri) — F(z:) — hf (x1) = F (ziya) — Fi) — hf (21). 


Cette expression va nous permettre d'obtenir une évaluation de l'erreur en effectuant un 
développement limité de F(x;,2) à l’ordre deux avec l’expression du reste de Lagrange, soit : 


F, = Fe) + hfl) + Fm) — Fa) -hf (ei) 


où y; est un nombre compris entre x; et t;+1. À partir de là, on obtient une estimation de E;, 
soit : 


suivie de celle de E : 


E= 9 > f(m). 


Cette expression prend une forme plus simple en majorant la somme, soit : 


h? (b— a)? 
E = — Re 
z NM 3N M, 


où M; est le sup de la valeur absolue de la dérivée f'(x) sur l'intervalle (a,b). 


2.2. La méthode des trapèzes 


En conservant les notations du précédent paragraphe, on désigne par s; la valeur de l’intégrale 
calculée entre deux points consécutifs x; et x;11 ; elle est approchée par s; : 


s= À em) + fe) 


qui représente la surface du trapèze déterminé par les points zi, tir, f(x:) et f(xi+ı). En 
désignant par 7’ l'approximation de l'intégrale J obtenue par sommation des s°, nous pouvons 
écrire : 


Nd h N-1 
r= 5 s; = 3 frv + f(zn)+2 5y ræ. 
i=0 


i=1 
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Estimation de l'erreur mathématique — Cette technique va nous permettre de gagner un ordre 
de grandeur en précision par rapport à la méthode des rectangles. Écrivons la nouvelle valeur 
de l'erreur que nous appelons F; : 


E; = s; — s; = F(ziy1) — Fri) — = [f (£i+1) + f(xi)] 


= Fin) = Fe) = $ Mein) + fE). 


DIS 


Effectuons un développement limité de F(x;:2) et de f(xirn) respectivement à l'ordre trois 
et deux avec les expressions associées du reste de Lagrange, soit : 


h h 2. 
3 Ji) zI (2i) 7 F(E) 


h? h3 
E; = F(x) + hf(æ:) + zf (Pa) ta f” (m) — F(z) 


où m; et &; sont deux nombres compris entre x; et £i}1. À partir de là, on obtient une estimation 
de E; è 


où 6; est un nombre compris entre x; et x;41. Il s'ensuit l'expression de E : 


h? N—1 


LES 2 f"(@:). 


Cette expression prend une forme plus simple en majorant la somme, soit : 


hè (b— a)’ 
E = AM = BN? M, 


où M est le sup de la valeur absolue de la dérivée deuxième f”(x) sur l'intervalle (a,b). 


3. La méthode de Simpson (1811-1870) 


La méthode de Simpson repose sur l’utilisation de la formule d'intégration dite des trois niveaux. 
Cela signifie que l’on réalise une interpolation parabolique au lieu de l’interpolation linéaire 
utilisée dans la méthode des trapèzes, mais le gain est plus conséquent car la formule des trois 
niveaux étant exacte pour un polynôme de degré trois, l’interpolation réalisée est celle d’une 
parabole cubique. Le calcul de l’erreur nous montrera qu’il en est bien ainsi, en constatant que 
son expression est proportionnelle à 1/N4. 

Toutefois, une légère différence existe dans le découpage de l'intervalle (a, b) qui est maintenant 
réalisé à l’aide d’un nombre pair de points, soit 2N ce nombre, ainsi h est donné par l'expression 
h = (b — a)/2N. Dans ces conditions, la formule d'intégration qui porte sur trois points 
consécutifs s'écrit : 


s! = à (C2) + 4f (2211) + fan), 
puise 
à 7 N-11 N-1 
H > s! = < Lite + f(an) +2 2 f(z) +4 > fean} - 
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Estimation de l'erreur mathématique — En adoptant le procédé exploité pour les méthodes 
précédentes, nous écrivons la nouvelle valeur de Æ; : 


Ei = si — $| = F(aaive) — Fa) = à LU) + An) + Las), 


h 
= F(z + 2h) — F(xx) — 3 [F (£2: + 2h) + f (£21) + 4f(œain)]. 
Effectuons un développement limité de F{xx + h), f(æx + 2h) et de f(x2; + h) respectivement 


à l’ordre cinq pour le premier et quatre pour les deux autres ; on obtient : 
3 4 


5 
E; = Dhf (e) + S'e) + Ele) + le + TESE) — 2 (FC) + hfa) 
2 gn 4h? 72) 2h° IV h 1 2 pr 
+R? S” (a) + Pa) + PV o) -3 (FC) +4) + Ahf' (e) + 2AF” (a) 


h3 4 
PM) + SV (8) 


où &, y; et 0; sont deux nombres compris entre £z; et Z2:42. À partir de là, on obtient une 
estimation de F; : 


Es = f (p) 
i= pp W! 


où p; est un nombre compris entre g; et æ;+1. Il s'ensuit l'expression de E : 


Il est aisé d’obtenir une forme plus simple en majorant la valeur de la dérivée sur l'intervalle 
(a,b), on obtient le résultat suivant : 

hë (b — a)? 

E = —N M4 = > 

90 4 2880N4 


où M4 est le sup de la valeur absolue de la dérivée d'ordre quatre sur l'intervalle (a, b). 


Ma, (ilya2N points), 


Remarque : Autant il est aisé de tirer des conclusions quand au rôle joué par N dans chacune 
des méthodes, autant il est impossible de savoir quoi que ce soit concernant les majorations des 
dérivées d’ordre de plus en plus élevé. Les quelques exercices que l’on peut mener facilement 
le montrent fort bien : dans bien des cas, la majoration d’une dérivée d’ordre m conduit 
à des résultats décevants qui contrebalancent le gain obtenu par la puissance de N (grand 
dénominateur). 
Prenons un exemple simple : 
10 
I = Jet dz. 

0 
Les dérivations successives de exp(—x?) génèrent des polynômes qui ont une grosse parenté avec 
les polynômes d’Hermite (cf. la formule de Rodriguès générant les polynômes d'Hermite). Tous 
calculs faits, on trouve les résultats suivants : Mı = 0,43, M2 = 0,893 et M4 = 10,95, ainsi, sur 
Pintervalle (0, 10), et l’on voit que 
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3.1. Méthode de Newton-Cotes (1682-1716) 


Soit une fonction f(x) continue sur (—1,+1) laquelle possède des dérivées continues sur le 
même intervalle jusqu’à l’ordre (n +1) au moins. On connaît un échantillon de la fonction f(x) 
constitué de (n+1) points y; = f (£k) correspondant à des abscisses en progression arithmétique 
Tr = —1 + 2k 


+1 
On se propose de calculer l'intégrale I = f f(x) dx au moyen d’une approximation J qui 
21 


consiste à remplacer f(x) par le polynôme de Lagrange donné par la formule de Lagrange, soit : 


k=0 —1 (£k z zj) k=0 
JFk 
Le calcul des Hp s'effectue au moyen du changement de variable zg = —1 + zuz ce qui donne : 
( 1e n 
= meje 1)... (u —k+1)(u— k- 1)... (u — n) du, 
0 
(1-42 f 
H, = << |P TA 
k AEK]! f (u) du 
0 


Nous allons transformer P£(u) en l’écrivant sous la forme suivante : 
n 
&) à 
Plu) = a lu, 
j=0 


lexposant (k) rappelant qu'il s’agit des coefficients du k° polynôme. Cette expression peut faire 
l’objet d’une intégration terme à terme à condition de connaître les af., Cela est aisé à l’aide des 
relations de Newton puisque l’on connaît les racines de P4(u) lesquelles sont les entiers positifs 
successifs à l'exception de k. On calcule au préalable les §™ qui sont les sommes des racines à 


la puissance m. 
L'intégration de Pk(u) entre 0 et n est immédiate. Si l'intervalle d’intégration est (a,b), le 


changement de variable permet d’obtenir : 


b-a. 


2 n 


fro dx = bS rh avec h = 
k=0 


L'expression de lerreur E = |I — J| est estimée à partir de l'expression de l'erreur commise 
en remplaçant f(x) par le polynôme de Lagrange Pr (x), soit : 


E=| | {/)- Pr(2)} dzl, 
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où Mn+1 est le sup du module de f(*+1){x) sur l'intervalle (a,b). Rappelons que le calcul de 
M1 est rarement simple. L'intégration du polynôme sous le signe somme est effectuée de la 
même manière que celle de Hz. 

Sur le Web (=). on trouvera le programme cotes_1.c qui réalise cette technique d'intégration 
suivi d’un autre programme cotes_2.c qui calcule la quantité : 


on+2 1 non ; 
Q(n) = me mi) file — j) dul. 
o J=0 


Il faut prendre quelques précautions pour calculer cette dernière intégrale. Si le principe que 
nous venons d'utiliser pour calculer les Hg demeure, la valeur absolue pose un problème que l’on 
surmonte de la façon suivante : comme la fonction à intégrer s’annule pour les entiers successifs, 
dans chaque intervalle constitué par deux entiers successifs, la fonction est soit positive soit 
négative (elle est alternativement négative puis positive etc.). Pour obtenir une majoration de 
l'erreur, il suffit d'intégrer entre deux entiers consécutifs, de prendre la valeur absolue du résultat 
et d'en effectuer la somme depuis zéro jusqu’à n. Au préalable, on aura écrit le polynôme de 
degré n + 1 sous la forme : 


à l’aide des relations de Newton. Les premières valeurs calculées sont données dans le 
tableau 12.2. 


Tableau 12.2. 


Q(n) 


0,823 1071 
0,968 107? 
0,973 107% 
0,888 1074 
0,717 10° 
0,529 1076 
0,3541077 
10 0,219 1078 


3 


S D I Oo CE 


Il est intéressant de s’arrêter sur le calcul d'erreur concernant l'exemple de l'intégrale de 


Gauss : 
1 i 2 
z£ 
I = —- Je —— | dx. 
Al =) 


*http://wuw.edpsciences.com/guilpin/ 
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La dérivée d'ordre n + 1 de l’expression sous le signe somme, notée g(x) est donnée par les 
polynômes d’Hermite (cf. chapitre 10) : 
dti 


n+l pi 
g(x) = Janri EXP 3 = (—-1) "TT Kn41 (£) exp >a" 


Cherchons le sup de la valeur absolue de cette expression dans l'intervalle (0,2). Désignons 
par Mn+1ı cette valeur. Elle est obtenue pour l’une des valeurs qui annulent la dérivée de g(x), 
soit : 


d”+? x? x? 
! “+ = n 
g'(x) es YP ( 7 ) = (—1)"Kn+2(x) exp (-7) : 


Ce sont donc les zéros du polynôme d’Hermite de degré n +2 qui sont les extremums de g(x), on 
les note ag. Il est facile de calculer les valeurs de g(a) correspondant aux racines a; contenues 
dans l'intervalle (a,b) ici (0,2), et de choisir la plus grande valeur absolue. Cette opération va 
être rendue aisée par l’usage des coefficients H4 calculés lors de l'intégration de Gauss-Hermite ; 
en effet nous avons : 


(n+2) (n + 1)!V2 
i (n + 2) [Kna (a) 


de là, on tire : 


Pour fixer les idées, choisissons n = 8, alors nous trouvons : 
J = 0,477 250 155 


La consultation de la table donnée chapitre 10 (concernant le polynôme de degré 10) nous montre 
que seules deux racines nous intéressent dans l'intervalle (0, 2), elles donnent des extremums du 
même ordre de grandeur et l’on trouve : 


M, 217, 
d’où 
217 
En = 8) < ——0,52910 7% = 4,610 *, 
V 2T 
et 


J = 0,477 25 + 0,000 46. 


Ce résultat peut apparaître médiocre, en fait il est dû à la majoration excessive de la 
dérivée d’ordre (n + 1). En général, il est très difficile de calculer formellement la dérivée 
d'ordre n d’une fonction, et rares sont les exercices qui le permettent, aussi ne s’attardera-t-on 
qu’exceptionnellement sur leur majoration. 

Cette raison explique pourquoi il n’est pas possible de comparer directement, dans le cas 
général, les résultats fournis par la méthode des trapèzes et par la méthode de Simpson puisque 
la première méthode donne une précision en fonction de la dérivée deuxième et la seconde en 
fonction de la dérivée quatrième. La comparaison n’a de sens que dans l’étude de cas particuliers 
au cours desquels on sait expliciter les dérivées et les majorer convenablement... 

Quoi qu'il en soit, ici, pour n = 8, les six premiers chiffres significatifs sont exacts... 
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13 | Intégration des équations 
différentielles 
dans le champ réel 


Ces types de problème relèvent du vaste cadre de l'analyse fonctionnelle. S’il est rare de trouver 
une primitive à une fonction donnée, il est encore plus rare de pouvoir exhiber une fonction f 
qui soit solution d’une équation différentielle donnée. Pour s’en convaincre, il suffit de considérer 
une des toutes premières équations différentielles rencontrées dans la physique : l'équation du 
pendule simple dans le plan. Désignons par 0 l'angle que fait le pendule avec la verticale et 
écrivons l’équation différentielle à laquelle obéit 0 au cours du temps t : 


d?4(t) 
dt? 


+ w’ sin[0(t)] = 0. 


Cette équation différentielle ne possède pas de solution formelle connue c’est-à-dire de solution 
exprimable au moyen des transcendances usuelles. D’autant plus que la nature des conditions 
aux limites peut singulièrement compliquer le problème à savoir : 


a. Conditions de Cauchy (1789-1857). On connaît à l'instant t = tọ la valeur de la fonction 
inconnue et de toutes les dérivées jusqu’à l’ordre le plus élevé figurant dans l’équation. 

b. Conditions aux limites (ou de tir). On connaît les valeurs de la fonction inconnue à des 
instants différents. 


Ici nous avons choisi le temps comme variable puisque l'exemple retenu est le pendule simple, 
mais rien n’est changé en faisant usage d’autres variables. 

Ici, nous ne cherchons pas à résoudre le problème différentiel dans le cas le plus général 
implicite que l’on écrit : 


d'y d"—ly dy 
F( dtr-1?°""? dt’? = 0, 


mais nous nous contenterons d'étudier le cas explicite suivant : 


d'y P dy dy 
dt” j (S T 
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Celui-ci se ramène à l’étude d’un système différentiel de n équations du premier ordre, en 
posant successivement : 


ce qui donne (n — 1) équations lesquelles jointes à Z = f(y,u,v,...,z) constituent un système 
de n équations différentielles du premier ordre. 

Dans un premier temps nous étudierons les techniques usuelles de résolution des équations 
différentielles du premier ordre dans le cadre du problème de Cauchy, puis nous procéderons 
aux généralisations qui permettront l’intégration des équations différentielles dont l’ordre est 
supérieur à un. 

Enfin, nous donnerons quelques indications à propos du problème aux limites qui ne concerne, 
cela va de soi, que les équations d’ordre supérieur à un. 


1. Les équations différentielles du premier ordre 


C’est donc le problème de Cauchy qui seul nous concerne ici. Sous la forme explicite, nous aurons 
à intégrer l'équation générale suivante : . 


d 
= s f(x, y), 


avec la condition que la solution doit prendre la valeur yọ pour la valeur xo de la variable. 


2. Les théorèmes d’Arzelà (1847-1912) 
et de Cauchy-Lipschitz (1832-1903) 


Il convient de s’assurer de l'existence d’une solution et la réponse est apportée par le théorème 
d'Arzelà que l’on admettra sans démonstration : 

Sous la seule condition que f(x, y) soit continue dans le rectangle zo < £z < zo+a, |y — Yo] < b, 
alors l'équation différentielle admet au moins une solution d(x) qui prend pour g = zo la valeur 
yo et qui est définie pour £o < £ < to + h, h étant le plus petit des deux nombres a et b/M où 
M = sup|f(x,y)| dans le rectangle considéré. Rien n’est changé si l’on remplace la condition 
To < £ < Lo +a PAT Æo — 4 <r < zro. 

À présent, c’est l’unicité de la solution qui va retenir notre attention, elle est assurée par le 
théorème de Cauchy-Lipschitz : 

Si de plus la fonction f(x,y) est lipschitzienne (cela signifie qu’il ny a pas de tangente 
verticale), soit : 


f(x, y1) — f(x, y) < Alyi — yl avec À fini, 


alors la solution (x) qui prend la valeur y pour la valeur zo de la variable est unique. En outre, 
dans le domaine précédemment défini, g(x) est continue. 
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Remarque : Si f(x,y) est infinie en un point particulier, il faut examiner s’il s’agit d’un pôle 
6 


LEOS 
f(x, y) 


elle conserve les bonnes propriétés puisque l’on pourra intégrer x en fonction de y. 


simple ou d’un point singulier essentiel. Dans le premier cas, si la fonction est régulière, 


On trouvera dans l’ouvrage de G. Valiron cité en bibliographie une démonstration de ces 
théorèmes au moyen de la méthode itérative de Picard (1890). Comme elle constitue aussi une 
méthode numérique simple à mettre en œuvre, nous allons nous intéresser à cet aspect. 


3. La méthode de Picard (1858-1941) 


La technique est intéressante dans la mesure où elle substitue une équation intégrale à une 
équation différentielle, soit : 


Î dz = p(z) - y = Í Flt, y(t)] dt. 


Nous allons former une suite de fonctions de la manière suivante : 


y(x) = yo + fre Yo) dt, 


ylz) = yo + I flt, 2 CP) dt, 


On montre alors que la limite de yn(£) quand n tend vers linfini est la solution unique de 
l'équation différentielle dans le cadre des hypothèses énoncées dans les théorèmes d’Arzelà et de 
Cauchy-Lipschitz. De plus, il convient de signaler que la série de terme général yn(£) — Yn_1(#) 
est absolument et uniformément convergente pour x appartenant à l’intervalle (xo, £o + h). 

La conduite du calcul est fort simple : 


a. On découpe l'intervalle d'intégration (a,b), dans lequel la fonction f(x,y) a les bonnes 
propriétés, en n sous-intervalles égaux définis par les points x, en progression arithmétique : 


b—a 
n 


ha et x =a+kh. 


ba 
b. Nous caleulons la fonction y1(x) = yo + f f(t, Yo) dt, c’est-à-dire l'ensemble des échantillons 
zo 
de yı(x) aux points £k. 
c. Ensuite, on calcule y2(x) à partir de yı(x) et ainsi de suite. 
d. On arrête les calculs lorsque les valeurs de y,(b) et yn+1(b) sont égales à la précision que l’on 
s’est fixé à l'avance. 
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Remarque 1 : Cette belle méthode itérative présente l'inconvénient d'être lentement conver- 
gente. 


Remarque 2 : Comme la méthode est absolument et uniformément convergente il n’est pas utile 
de conserver la fonction y,(x) intégralement avant de procéder au calcul de la fonction suivante 
Yn+1(x). I suffit donc d’écraser les valeurs au fur et à mesure des calculs. Non seulement cette 
remarque simplifie grandement la programmation mais encore elle accélère la convergence du 
procédé. 


Précision de la méthode 


La suite de fonctions étant absolument et uniformément convergente, sur le plan strictement 
mathématique, il suffira d’effectuer les calculs à un ordre suffisamment élevé pour obtenir la 
précision souhaitée à l'avance. Par suite, on est en droit de penser que c’est la technique 
numérique retenue pour calculer les intégrales qui limite la précision des résultats (elle est 
fonction du pas A). Les problèmes sont malheureusement plus compliqués que cela. 

On trouvera sur le Web ©) le programme picard.c qui réalise cette procédure. 


4. Méthode de la série de Taylor 


Nous allons développer la fonction y(xx+1) au voisinage de y(x4) en série de Taylor en utilisant 
les notations y et Yk+1 : 
— PAL LEP PAL PUR 
Yk+1 = Yk 112 2! Yk 3 Yk 
yi est donné par l’équation différentielle et vaut simplement f(£k, Yk), ensuite, par dérivation, 
on obtient : 


n (£ dr of w) “(+ 


Yk = ðr dr i oy ` de ðr ðy ý je AE 
et 
PE PF prof nf 
m 2y! 12 HEC = ; 
y} (Z + 2y 30; + (y) ans tY AR l(£k, Yk) 


On peut aller aussi loin que ce que l’on désire. 

La technique de calcul est simple : à partir de zo et yo on calculera yı au point x1, puis yz au 
point 22 et ainsi de suite jusqu’à £n = b. 

Lorsque l’on arrête le développement en série de Taylor au premier ordre, la méthode s’appelle 
méthode d’Euler. 

On trouvera sur le Web (*) le programme taylor.c qui met en œuvre cette technique. 


*http://wwuw.edpsciences.com/guilpin/ 
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5. Méthodes de Runge (1856-1927) et Kutta (1867-1944) 


5.1. La méthode en trois points 


Nous allons présenter cette technique de façon géométrique, puis nous verrons ce qu’elle signifie 
analytiquement et nous proposerons une généralisation à plusieurs points. 

À partir du point A(æo, Yo), nous calculons au moyen de la méthode d’Euler les coordonnées 
du point B [zo + h/2, y(xo + h/2)|, soit : 


y (a + z) = yo + hf (z0, y0)/2. 


On détermine le point C [xo + hk, y(£o + h)] en effectuant une interpolation parabolique, c’est-à- 
dire en supposant que les trois points A, B et C sont sur une parabole. Pour cela on utilise une 
propriété géométrique de la parabole selon laquelle la tangente en B à la parabole est parallèle 
à la sécante AC. On peut alors écrire : 


yı = ylzo + h) = yo + hf [ro + h/2, yo + hf (£0, Yo)/2]. 


L'ordonnée de C n’est pas la valeur définitive que nous allons conserver comme approximation 
de l'intégration en zo + h. La formule des trois niveaux permet de trouver une meilleure 
approximation de C en écrivant : 


zo+h zo+h h 
dy= f Faute) de = yi = w = $ [FCA +4/(B)+ SCC) 


TO TO 


expression dans laquelle f(A) signifie f(xo, yo) 


f(B) signifie f [zo + h/2, yo + hf (zo, vo)/2] 
f(C) signifie f (zo + h, yo + hf (ro + h/2, yo + hf (zo, vo)/2)). 


La technique de calcul consiste à écrire : 


Uo = f(xo,%), 
U, = f(zo+h/2, yo + hUo/2), 
U = f(xo+h,yo + hUi), 
. h 
puis y = Yo+ 6 [Uo + 4U: + Un]. 


Ensuite, à partir de y1, on calcule y2 et ainsi de suite jusqu’à atteindre la borne b souhaitée. 

On trouvera sur le Web (*) le programme runge.c qui réalise cette procédure. 

Cette procédure montre que l’on itère trois fois la fonction f(x, y). Nous pouvons retrouver 
ce même résultat par voie analytique. Cette façon de procéder est généralisable ce qui permet 
d'augmenter la précision des résultats. Sans s’attarder sur les développements, nous donnons les 
résultats du calcul en quatre points. 


*http://vuw.edpsciences.com/guilpin/ 
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5.2. Les méthodes en quatre points 


Il existe plusieurs variantes de la méthode, en voici deux : 


1. On calcule les valeurs suivantes : 


Uo = hf (to, Y0), 

U, = hf (zo + h/3, yo + Uo/3), 

U = hf (xo + 2h/3, yo — Uo/3 + U1), 

Uz = hf (£o + h, yo + Uo — U1 + U2), 
3U: 3U2 Us | 


Uo 
h) = 
et y(xo+h) y(zo) + -5 + E + 3 +2 


2. On peut aussi calculer cette autre suite : 


Uo = hf (£0, Yo) , 
U, = hf (zo + h/2, yo + Uo/2), 
Uz = hf (zo + k/2, yo + U1/2), 
Us = hf (xo + h, yo + U2), 

Uo U U U: 


et y(ro+h) = gro) + + + T 


Il faut savoir que les coefficients numériques sont calculés par identification de la formule 
présentée et du développement en série de Taylor le plus élevé possible. 


5.3. Les méthodes en seize points (ordre 8) 


Il faut résoudre un système de 285 équations pour satisfaire les conditions d’identification et 
en 1981, P.J. Prince et J.R. Dormand ont réalisé ces calculs et ont produit les coefficients 
numériques jusqu’à 16 points. 

Souvent nous utilisons leurs résultats pour intégrer les équations différentielles, et ceci de la 
façon suivante : on intègre avec la méthode d’ordre 7 et l’on estime l’erreur à l’aide de la méthode 
d'ordre 8 qui sert de référence. Ceci permet de calculer aussi le pas d'intégration adapté au type 
de l’équation différentielle que l’on traite. 

On retrouve ce type d’intégration dans quelques programmes fournis avec les corrections de 
problèmes (cf. annexes H et I). 


6. Les méthodes d'Adams (1819-1892) 


On se propose de calculer la valeur de la solution y; pour la valeur correspondante de l’abscisse 
zj. Les abscisses ne sont pas nécessairement en progression arithmétique et l’on les note 
simplement dans l'ordre croissant {£o < £1 < £2 < +: < n°: < Im} =T, T étant l'intervalle 
sur lequel on désire effectuer les calculs et sur lequel la fonction f|x, y(x)] a les bonnes propriétés 
énoncées dans le théorème de Cauchy-Lipschitz. On note hn = n41 — £n. 
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On suppose que l’on connaît les n premières valeurs qui ont pu être obtenues au moyen d'une 
méthode de Runge et Kutta par exemple. On se propose de calculer la valeur de y,}1 au point 
Xn+1 au moyen de la relation : 


Ln+1 
YUn+1 = Yn + i fiz, y(x)] dz, 
expression dans laquelle nous allons approcher la fonction f|x,y(x)] au moyen du polynôme 
d’interpolation de Lagrange de degré v, ce qui signifie que la détermination de ce polynôme 
nécessite la connaissance de v + 1 valeurs calculées précédemment. 
6.1. Méthode de Adams-Bashforth 
On désigne par P,\A(x) le polynôme de Lagrange de degré v qui interpole la fonction fle, y(x) 
dans l'intervalle (r,,%h+1). On adopte la notation : 
Palin: = Flers us) == În-j avec j = 0,1,...v. 

La valeur approchée de yn+1 est donnée par l’expression : 

n+l 


Yn+1 = Yn + Î Pate) dz, 


on en déduit la valeur de f,11 : 


fnr = f (n41; Yn+1)- 


Explicitons le polynôme de Lagrange : 


LA 


Pn (2) = yha II eink 
j=0 


k=0 Ln—ÿ — n-k 


kžj 
On peut poser : 
TO rT 
T Ln-k 
Lee) Los 

k=0 LTn—j — n-k 

kžj 
puis : 

n+l Tn+1 


r Ta~ Lh— 

J NE 

k k=0 Zn—j — n-k 
n” k#j 


En définitive, la méthode d’Adams-Bashforth à (v + 1) pas s'écrit : 


1 1 
Belle i I Linj(x) dz = m 


vV 
Yn+1 = Yn + 5y hnBunjfn-j avec n >v, 
j=0 


et 


fni = f (En+1, Yn+1)- 
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Remarque 1 : Il faut une plate-forme de démarrage pour appliquer l’algorithme d’Adams- 
Bashforth, elle peut être obtenue par une méthode à un seul pas telle que celles que nous 
avons présentées précédemment. 


Remarque 2 : Rien n’interdit de modifier le nombre de pas au cours des calculs. 

Remarque 3 : La taille des pas hj n’est commandée que par des considérations sur la précision 
et la stabilité. 

Remarque 4 : Comme la méthode existe pour v = 0 (il s’agit de la méthode d’Euler), il suffit 


de concevoir un programme qui fonctionne avec un pas variable de 0 à v, ainsi l’algorithme 
devient «auto-démarrant ». 


6.2. Cas où les x; sont en progression arithmétique 


On désigne alors simplement par À le pas, et l’on remarque que le polynôme d’interpolation de 
Lagrange est également le polynôme ascendant de Newton (cf. chapitre 6) ; ainsi L,,;(x) prend 
une forme plus simple que l’on désigne par l„;(x) car, comme on va le voir, cette expression ne 
dépend pas de n : 


Par ailleurs, nous avons vu que le polynôme de Newton ascendant (cf. chapitre 6) pouvait 
— En 


h 


f T 
s'écrire, en posant u = , Sous la forme : 


u(u +1) (u+v-— 1) 


Pyn(u) = fn +UA fn + J! 


u(u +1) 5 


qui s’exprime avec la notation plus concise : 


er) E PeDe 


de la manière suivante : 
A aje fu+j-1 
Pal Dah 1 ) $ 
J=0 2 
De là, on obtient : 


1 
l u+j—1 Y ; 
Yn+1 “un + ais ] ( : ) u= m +h} nas, 
0 


j=0 j=0 
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avec 


A dé 


Il y a moyen de calculer directement les y; ainsi que les by; qui en découlent, si bien qu'il n’est 
plus utile de calculer les différences successives des fn. Les expressions à exploiter s'écrivent : 


yY 
Yn+1 = Yn + DD brjfn-j avec n>v, 
j=0 


et fn+1 = f (Enti Yn+1)- 


6.3. Calcul des coefficients ~j et b,; 


Nous allons montrer que les yẹ sont les coefficients du développement en série entière de la 
fonction : 


k=0 


1 
= fac) js de = D rt. 
0 


En effet, la dérivation successive sous le signe somme, puis légalisation à zéro de x conduit 
au développement en série de MacLaurin de S(x), et l’on trouve que : 


a dé 


D'un autre côté, l'intégrale est directement calculable : 


1 


s= fi (1 — x) * da = Jexpt-etos, (1 — æ)] da = Ta > (=) f 


0 


Nous pouvons donc écrire : 


Le développement en série entière de cette expression donne : 


(En) [- Dn ) = —1. 


L'identification des termes de même puissance en x conduit aux relations : 
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soit encore : 


m—t m—1l 
Yk Yk 
Ym = ; 
K 2 ei (m-k+1) 
T Yk Å. Yk 
a (m-— k) = (m—k+1) 


Cette dernière relation est donc vraie quel que soit m, et légalité demeure en remplaçant m par 
m — 1 ou (m + 1) autant de fois que cela reste compatible avec le fait que m est supérieur ou 
égal à zéro. En particulier, elle est vraie pour m = 1 dans le premier membre et m quelconque 
dans le second, ainsi on trouve : 


quel que soit m positif. 


— = Yk 
m Ter PE 


À partir de cette relation on calcule la suite y1, Y2, y3 et ainsi de suite. 
Le calcul des b,,; s'effectue en fonction de by—1,; et de y, pour 0 < j < v. D'abord, il est aisé 
de calculer b,,, à partir de la relation de définition : 


t lv- k 1, 1 
Uia v u v 
w= [uw [IE du=( 1) = (—1)"y. 
E k=0 J k=0 


À présent, exprimons /,,(x) en fonction de z+v—1). On peut écrire, pour j < v : 
3 v J 


L(x) = (1) Ci C pa 1) stv, 


v +3 


De la même façon, on calcule l,_1,;(x) : 


so = (PO 


V 


Maintenant, effectuons la différence ly;(£) — L,_1,5(x) : 


Dee EE i +v j É $y de 1) saiyo 4 + / _ 1) | 


v t+] z©r+J 


Intégrons terme à terme sur (0,1), on obtient : 
br; = b-i +(—-1) Cyr avec 0 < j < v. 


En définitive, nous savons calculer les b,,; sans difficulté à partir des yp. Sur le Web (*), on 
trouvera le programme bashfort.c qui utilise cette technique de calcul. 


*http://wuw.edpsciences.com/guilpin/ 
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6.4. Méthode de Adams-Moulton (1872-1952) 


Au fond, il s’agit d’une variante de la méthode qui vient d’être exposée. La différence provient du 

fait que le polynôme d’interpolation passe par fn+1 = f (Tny1, Yn+1) valeur qui ne sera connue 

que lorsque la valeur de y,:1 sera connue. On comprend alors que la nouvelle technique soit une 

méthode implicite car il nous faudra résoudre une équation implicite pour obtenir la valeur de 

Yn+1. Le gain de la méthode repose sur le fait que le polynôme d’interpolation gagne un degré. 
Nous posons donc : 


Qurin(tn-;) s= f (Ea —j Y Y(Tn _;)] avec j = 0, 1, asen: 
|= 


plus Quyi,n(En+1) = f (En, Y(En +1) În+1; 


cette dernière valeur est inconnue. 
Le polynôme de Lagrange qui interpole dans le n° intervalle est alors de degré (v +1). Il prend 
la forme : 


v+1l v+1 v v 


Qurmnla rare IT A D fs I EE, 
i E 


o n+l- — Tn+i-k 


soit encore : 


Qi SS fn- —j L,+1 n+l, j+1(T). 


pia! 
Comme précédemment, posons : 
Tn+l 


Lytin+1,5+1 (x) dz. 


Tn 


La technique de résolution consiste à séparer ce qui est connu de ce qui doit être calculé par 
résolution d’une équation implicite : 


LA 
Yn+1 — haDin,-1f(tn+; Yn+1) = Yn + yy hn Dunjfn-j avec n 2 v. 
j=0 
(Le membre de droite est une constante calculable directement, et il reste à résoudre l’équation 
implicite figurant dans le premier membre égale à ladite constante.) 
6.5. Cas où les x; sont en progression arithmétique 


L'expression du polynôme de Newton devient : 


u(u +1) 
2! 


u(u+1)-.-(u+n) 


n+1 


A? Pad 1+- 


Oro x) = fansi F Aai + 


v+1l 
k—1 — 
(e + ) Ae eae Toii ; 


Ici encore, nous pouvons nous dispenser du calcul effectif des différences successives, seules 
les valeurs fẹ pourk =n +1,...,n — v devront être connues. 
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La quantité Dynj ne dépend plus de n et l’on désigne par d,; cette nouvelle expression qui 
s'écrit (attention au changement de variable qui définit u) : 


0 0 v+ k 
ba 
dy; = fims au= f pu du. 
—1 1 


De là, on extrait : 


pal f u+k—1 EH ; 
Yn+1 = +Y Afan f ( k }au= um +n 3 GA fa 


k=0 ži j=0 


aeS ae Jets A 


DL’expression générale à itérer devient plus simple : 


avec 


Yn+1 — Rhndyj1f (Ends Yn+1) = Yn + D» Randy fn-5. 
5=0 


6.6. Calcul des coefficients 6; et d,; 


Nous allons relier les coefficients 6; aux coefficients yp. Écrivons ô; et effectuons le changement 
de variable u — 1 = x: 


o= f(t) a - je CE (+52 à, 


puis décomposons le dernier membre sous le signe somme : 


(æ—1}z(c+1).-(z+i-2) x(t+1).-.(&+37—2) (= +) 
j! E (j -1)! j 
_- æ(æ+1) --(£+j—2)/z-1 
gen (1 #1) 
__æ(t+l)...(z+3-72) (Et) 
p (ra j 
z(z+1) --(£+j—2) x(x+1).--(r+7-1) 


g (j -1)! I | 
à présent il suffit d'intégrer de zéro à l’infini et l’on obtient : 
ô; = yj — 5-1 avec ĝo = 1. 


Nous pouvons également calculer directement la suite des ô; en réutilisant la relation établie 
à propos des 7;, à savoir : 


m—1 m 

Yk Yk 
> P3 … 
rue (m —k) = (m—k+1) 
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Le développement puis la factorisation des coefficients qui ont le même dénominateur permet 
d'écrire : 


Yo n pop i T Imit 


= mel m j +e + (Ym-1 — Ym), 


ce qui donne : 
m ô 
0 = 5 -h quel que soit m positif. 


Il nous reste à exprimer les dy; en fonction des ĝj. Nous avons d’abord : 


0 0 v 

= v+1 u—k = v+l 
w= fun jan JTE a (=1) [en Ôy+1- 
21 21 KE 


z+v 


none On peut écrire, pour 


Comme précédemment, nous écrivons l+1;+1(x) en fonction de ( 
1 <V: 


(= 1)+1 Qi Eee 


l1, j+1(£) = v+l v+1 r+j $ 1 


Maintenant, effectuons la différence lp41,j41(£) — luj+ (£) : 


+v z+v+l V — j 
l j — ly; = DC a 
+1,j+1 (2) j+(£) = (—1) vH| 47 z+j+1 æ+tj+l 


= ME) 


L'intégration de deux membres sur l'intervalle (—1,0) permet d’obtenir : 
duj = du-1,5 + (— DAE OET AS avec 0 < j < v. 


Ici encore, on sait facilement calculer les d,,; en fonction des 6,41. 
On trouvera sur le Web (*) le programme moulton.c qui réalise l'intégration numérique des 
équations différentielles du premier ordre au moyen de cette procédure. 


7. La méthode des différentiations rétrogrades 


Il existe une catégorie de problèmes différentiels qui sont particulièrement rebelles aux méthodes 
d'analyse usuelles, c’est-à-dire les méthodes de Runge et Kutta et les méthodes d’Adams. 
Bien que les conditions de Cauchy-Lipschitz soient vérifiées, il peut arriver que la structure 
de l'équation différentielle soit tout à fait mauvais, c’est-à-dire que la discrétisation explicite fait 
apparaître des instabilités. Ce type de problème porte un nom : il s’agit de problèmes raides, 
on n'obtient pas d’approximations numériques convenables à l’aide des méthodes usuelles. 


*http://wwuw.edpsciences.com/guilpin/ 
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Lorsqu'on rencontre un problème raide, ces difficultés peuvent être éventuellement contournées 
en utilisant des méthodes adaptées, et il convient de tester les méthodes de Runge et Kutta 
implicites ou la méthode des différentiations rétrogrades. Nous présentons maintenant cette 
dernière méthode. 

L'idée consiste à interpoler la suite des y, par le polynôme de Lagrange IL,,(x) de degré 
v (n > v +1). Le polynôme sert alors à trouver une approximation de y,}1 pour la valeur 
£ = En+1, ainsi nous écrivons : 


Hyn(£n+1-k) = Yn+1—k avec k = 0, 1, cs. 
Pour obtenir la valeur de yn+1, on écrit que : 


im) = f (Enti; Yn+1)- 


T=Tn+1 


Nous allons expliciter le polynôme de Lagrange dans le cas particulier utile où le pas est 
constant et vaut h : 


v v 

X } T — Tn+i-k 
Ihr) = Yn+l-j lI 

jJ=0 k 


o n+1—j — Tn+1—-k 
kžj 


On désigne alors par myn(u) la nouvelle expression qui prend la forme suivante : 


—u + k z 1—% 
Ton(u) = D mt II = en posant : u = -1 . 
3=0 k=0 
kžj 
On obtient alors : 
Thn(0) = —hf (tn+1: Yn+1) > 
£ — Z — k 
et Tun(£k) = Ynii-k avec k=0,1,...,0 où ép = HR t, 


h 


Nous allons dériver ,,(u) par rapport à u, après avoir donné son expression en fonction de : 


int = G-E) 


m=1 


ainsi que de sa dérivée q/,(u). Développons 7, (u) de la manière suivante : 


k=1 k j=1 k=0 k-j 
k#j 
On note que, puisque j Æ 0 : 
E ute ara (t) I (1-}). 
ko © J ki T7 1—— / ka 
kžj kžj J kžj 
et que 
Z l/m 


208 


ce qui donne : 


Donc : 
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1 
dn (0) = — >. m cr Qun(0) = 1. 


Tun(u) = Yn+14un (U) + Y omga t Ji (ı Z 2) R 


ar Lu 
L j kžj 


Dérivons par rapport à u et faisons u = 0 : 


vn (0) = Yn+14pn (0) + 5y 


= —hf (En+1; Yn+1)- 


V 


En réécrivant la dernière égalité, on obtient : 


soit encore : 


hf (n41, Yn+1) … 


Un = = CE | 
i Gin (0) aa ( j ) 


k=1 
RZÍ 
hf (En+1: Yn) À Yn+1-j 
Yn+1 — CRE TAC + i 
Z> j=l ; Ea Laii 
2 m £ > m Il (1 i) 
j=1 j=1  k=1 
kj 


Formellement, on peut écrire une expression semblable à celles établies à propos des méthodes 


ďd’Adams : 


avec : 


et 


14 
Yn+1 — ha f(tn+1; Yn+1) = > QGyjUn+1- 5) 
j=1 


Qy 


loj meo y AN 
(5) 
k=1 


kžj 


Sur le Web @, on trouvera le programme retrogra.c qui réalise cet algorithme. 


*http://www.edpsciences.com/guilpin/ 
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8. Les équations différentielles du deuxième ordre 


L'étude des équations différentielles du deuxième ordre relève de l’étude des systèmes d'équations 
différentielles du premier ordre, et elles en constituent un cas particulier. En effet, écrivons 
l'équation résolue par rapport à la dérivée seconde qui soit la plus générale possible dans ces 
conditions : 

dy 1 

“dr = g(t,y,Y') 


il est alors possible, comme nous l'avons vu précédemment d’écrire : 


dy 
Era 
Z = g(x, y, 2). 


Il ne coûte rien d’étudier le système général suivant : 


w = f(x, y, z) 
Z = g(x,y, 2). 


8.1. Cas du problème de Cauchy 


En zo, on connaît les valeurs % et 20, alors le théorème de Cauchy-Lipschitz se généralise de la 
manière suivante : 

Si les fonctions f(z, y,z) et g{x, y, z) sont continues dans le parallélépipède £o < £ < zo +a, 
ly — yol < b et |z — zo| < c, et si les fonctions sont lipschitziennes c’est-à-dire que : 


|F (z,y, z) 7 f(x, yz) < A|y— yl +B|z — |, 
\g(æ,y,2) — g(x,m,a)| < Aly -yl + B|z- zl, 


alors le système différentiel du premier ordre (ou l'équation différentielle du deuxième ordre) 
admet une solution unique y = (x) et z = y(x) laquelle prend pour z = zo les valeurs 
{xo) = yo et Y(zo) = z% et qui est définie pour zo < x < zo + h, h étant le plus petit des trois 
nombres a, b/M et c/M où M étant la borne supérieure de |f| et |g| dans le parallélépipède 
considéré. 


a — Méthode de Picard — Nous formons la suite de fonctions de la manière suivante : 


y(x) = yo + J F(t, Yo, zo) dt 
zo 
ax) = zo+ f g(t, Yo, zo) dt 


To 
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puis 

y(x) = yo+ f f(t; yı, a) dt 
zo 

z2(x) = z+ f g(t,yı, 21) dt 
z0 

Yn+1(7) = Y+ f f(t, Yn Zn) dt 
To 

Zn+1(T) = 20+ J g(t, Yns Zn) dt. 
To 


b — Méthode des séries de Taylor — Il suffit d'écrire les expressions suivantes : 


h / à h° mi 
YkHi = Yk+ TÉL TA + 3r Yk t“ 
h a hè 
Žk41 = Zk + Gk t gk t g t 
avec Yk = f (Tk, Yk žk) 
Zk = g(Tk, Yk, žk), 


ensuite, par dérivation, on obtient : 


ðf dr ðf dy ðf dz of ðf of 
un _ [OS dx _ OJ dy of CL L 
Yk 7 (% dx + ðy dr Fe Pl Fe z F ðy y F 3z 2 3 k(Tk, Yk, Zk) 


ðg dr ðg dy ðg dz ðg ög Əg 
n __[ 99 0g ðg dz foi oa ,, 0, S 
LE a ðy dr ðz dr ta Yta? l(Tk, Yk Zk)» 


et ainsi de suite. 


c — Méthode de Runge et Kutta en trois points — La technique de calcul consiste à écrire : 
Uo = f (to, Yo, 0), 
Vo = f (£o + h/2, yo + hUo/2, 0), 
Wo = f (zo + h, yo + hVo, z0) , 
Ro = g (to; Yo, 20) , 
So = g (£o + h/2, Yo, zo + hRo/2) , 
To ark Yo, zo + RSo), 


puis yı = Yo + — dun +4V + Wo], 


z1 = 2+7 à [Ro + 450 + To]. 


Ensuite, à partir de yı et 21, on calcule yz et 22 jusqu’à atteindre la borne b souhaitée. 
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d — Méthode de Runge et Kutta en quatre points 
1. On calcule les valeurs suivantes : 
hf (to, Yo; 20) , 
hg (£0, Yo: 20) ; 
U, = hf (xo + h/3, yo + Uo/3, 2), 
hg (zo + h/3, Yo, zo + Vo/3), 
Uz = hf (zo + 2h/3, yo — Uo/3 + U1, 20) , 
Va = hg (zo + 2h/3, Yo, zo — Vo/3 + Vi), 
= hf (xo + h, yo + Uo — U1 + Ur, z0), 
Vs = hg (£o + h, Yo, Zo + Vo — Vi + V2), 


Uo 3U 3U2 U3 
et y(ro+h) =y) + + + + 


VW 3V 3W V 
z(zo + h) = 2(x0) + + a + = 


2. On peut aussi calculer cette autre suite : 

(£0, Yo, Z0) ; 

(to; Yo; 20) ; 

£o + h/2, yo + Uo/2, 20) , 


V= h 
hf( 
"=t + h/2, Yo, zo + Vo/2), 
hf (xo + h/2, yo + U1/2, z0), 
hg (za + h/2, yo, zo — V1/2), 


AIDE yo + Up, 20), 
= hg (£o + h, Yo, 20 + V2), 
Uo U U: Us 


et E CHATS 


o ARR CURE 
z(zo +h) = 2x0) +++ tE 


e — Méthode d'’Adams-Bashforth dans le cas d’un pas constant 


V 
Yn+i = Yn + RS brifn-s avec n > v, 
3=0 


et 


fn = (Ent Un+1; Zn41), 
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puis 


124 
Znj = En +h X byjÿn-j avec n>n, 
j=0 


et 
n41 = J(En+1; Yn+l; Zn+1) 


Sur le Web (*) figure le programme pendul_0.c qui met en œuvre cette technique. 


f — Méthode d'Adams-Moulton dans le cas d'un pas constant 


vV 
Yn+1 — hdj- f (En+1, Yn+1» Zn+1) = Yn + 5 hd; fn; avec n 2 1, 
j=0 


YV 
Zn+1 — hdyj—19 (nn Zn+1) = Zn + + hd,j9n-j avec n > y. 
j=0 


Remarque : Ici, il y a à résoudre un système non linéaire de deux équations à deux inconnues 


dont les racines sont Yn+ı et Zn+1. Toutefois, si le prix du calcul est trop élevé, on pourra se 
contenter de l’algorithme suivant : 


Yn+1 — hd,j5-1f (n41, Yn+1; Zn) = Yn + 5 hd, jfn-; avec n >v, 
j=0 


14 
Zn+1 — Rdyj-19 (n41, Yn+1, Zn+1) = Zn + J hdyj9n-; avec n >v, 
j=0 


dans lequel on n’a plus qu’à rechercher la racine locale d’une première équation implicite qui 
donne Y»+1 puis la racine d’une seconde équation implicite qui permet de déterminer 2,41. 
g — Méthode des différences rétrogrades 
Y 
Yn+1 — ha, f (En+1; Yn+1; Zn+1) = Y oaa 
j=1 


yY 
Zn+1 — hayg (n41, Yn+1, 2n+1) = X Qvjčn+1-j: 
j=1 


Ici encore on retrouve le problème rencontré lors de l’utilisation de la méthode d’Adams- 
Moulton, on le traite de la même façon. 


*http://www.edpsciences.com/guilpin/ 
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8.2. Le problème aux limites 


On peut rechercher une solution y = @(x) et z = y(x) telle que, par exemple, elle admette 
Yo = (to) et yı = (x1) ou encore yo = (zo) et z1 = Y(x1), avec dans les deux cas zo # z1. 

Il n’y a plus de théorème d'unicité analogue à celui de Cauchy-Lipschitz. Le problème est plus 
délicat, et pour s’en convaincre, il suffit de considérer l’équation du pendule. On se donne go et 
yo à to. Il est bien clair que l’on ne peut pas imposer une seconde condition n'importe comment : 
elle doit être compatible avec les liaisons du système étudié. Lorsque ce problème de conditions 
aux limites se présente, on peut l’aborder de la façon suivante : 

On fixe une condition, par exemple yọ = @(xo) et l’on choisit arbitrairement l’autre condition 
à la même limite pour to, soit 20. La technique consiste à ajuster z de telle sorte qu’à la limite 
zı la seconde condition imposée soit remplie. L’ajustement de zo s’effectue par tâtonnements en 
essayant de trouver deux valeurs Za et z (qui encadrent la valeur cherchée zo} à partir desquelles 
on recherche zo par dichotomie, d’où son nom : la méthode de tir. 


9. Équations différentielles d'ordre supérieur à deux 


Ce qui a été dit pour le deuxième ordre peut être généralisé sans grande difficulté pour les ordres 
supérieurs et les algorithmes se transposent de la même manière que celle qui a été présentée 
pour le deuxième ordre. | 
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14 | Intégration des équations 
-~ aux dérivées partielles 


Nous nous proposons d'étudier quelques méthodes d'intégration d'équations aux dérivées par- 
tielles du premier et du deuxième ordre dans le champ réel. Ce problème généralise l'intégration 
des équations différentielles ordinaires lesquelles ne dépendent que d’une seule variable ; à partir 
du moment où nous sommes en présence de plusieurs variables, dans les équations, figurent, 
presque de façon inéluctable, des dérivées partielles. 

Cette remarque induit une conséquence immédiate : les méthodes que nous allons développer 
peuvent également s'appliquer à la résolution des équations différentielles ordinaires. 

Hormis quelques techniques très pointues attachées à des problèmes d’espèce et qui sortent 
du cadre de cet enseignement, on peut dire que, grosso modo, les méthodes utilisées ont toutes 
en dénominateur commun la réalisation d’un maillage se superposant au domaine D sur lequel 
on désire effectuer l'intégration numérique. C’est aux nœuds de ce maillage que l’on calcule les 
valeurs de la fonction faisant l’objet de l’équation aux dérivées partielles. On voit bien qu’il 
s’agit de la généralisation de la notion de pas, celui-ci pouvant être constant ou variable selon 
les besoins. 

Le premier problème qui se pose concerne les domaines ayant un point à l'infini, tandis que 
le second concerne les techniques à pas variables. Il ne faut voir là que des problèmes liés à 
la géométrie du domaine ainsi qu’à la nature de l’équation aux dérivées partielles. Ce sont les 
raisons qui expliquent qu’il existe deux types de méthodes numériques pour intégrer les équations 
aux dérivées partielles : 


a. les méthodes aux différences finies, 
b. les méthodes aux éléments finis. 


Fondamentalement, ce sont les mêmes techniques qui utilisent les mêmes approximations 
des opérateurs différentiels, et ce qui les différencie repose sur la technique de maillage du 
domaine considéré. Les méthodes aux différences finies exploitent un maillage à pas constants 
(quel que soit le type de coordonnées utilisées) et proposent deux types de résolution : l’une 
est explicite, c'est-à-dire que les inconnues aux nœuds du maillage sont données explicitement 
par les équations, l’autre est implicite, alors les inconnues constituent un système linéaire qu’il 
convient d'inverser. Dans ce dernier cas, on a affaire à une matrice « creuse », c’est-à-dire ne 
comportant que des zéros hormis la diagonale et son voisinage, il existe alors des méthodes 
d’inversion spécifiques de ce type de matrices (cf. le chapitre 5 consacré au calcul matriciel). 

Les méthodes aux éléments finis proposent un maillage adapté au type de problème considéré : 
là où la fonction inconnue varie beaucoup, le maillage est serré, là où la fonction inconnue varie 
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peu le maillage est très grand. Cela conduit à une sorte d'optimisation du temps de calcul et 
de la quantité de calcul, mais, en revanche, conduit à des études préalables longues et coûteuses 
qui restent en général du domaine du spécialiste. C’est précisément la méthode retenue dans 
Tétude de la résistance des matériaux ; on note à ce propos que l’on a affaire à des domaines de 
même type. 


1. Considérations sur les équations aux dérivées partielles d'ordre 
au plus égal à deux 


Dans un repère cartésien orthonormé tridimensionnel de coordonnées (x, y, z), l'équation aux 
dérivées partielles du deuxième ordre la plus générale à laquelle obéit la fonction ® s’écrit de la 
façon suivante : 


( oð 0% 0 Po Po PE PP 0% re) 
f , r, y, zZ 


* 0x” ðy’ Əz’ x2’ Oy? z2’ Əxðy’ ðxðz’ ðyðz 


Ici encore, les cas offerts par la physique sont généralement des formes explicites, et c’est 
plutôt l'étude des formes linéaires qui va retenir notre attention. Nous limitons toutefois notre 
étude aux équations linéaires à deux variables indépendantes x et y (ou t), ainsi léquation 
devient : 

2P 2P > 
A(z, y) + B(x,y)=— + C(x,y) > + D =0 
(zy) zzz +B. LE ( ET 


où D est une fonction pouvant dépendre linéairement de ®, gE et gr uniquement. 

L'analyse de ce cas particulier permet de distinguer trois types d'équations aux dérivées 
partielles linéaires du deuxième ordre selon les racines de l'équation caractéristique (théorie de 
Monge (1746-1818) - Ampère (1775-1836)) : 

1. B'(x,y) — 4A(x,y)C(x,y) < 0 : c’est le type elliptique, il s’agit de l'équation de Poisson 

(1781-1840) qui admet comme cas particulier l’équation de Laplace, 

2. B'{x,y)}—-4A(x, y)C(x, y) = 0 : c’est le type parabolique, le prototype est fourni par l'équation 
de la propagation de la chaleur ou encore de la diffusion, 

3. B(x, y) — 4A(x,y)C(x,y) > 0 : c’est le type hyperbolique dont l’exemple est l’équation de 
propagation des ondes (cordes vibrantes par exemple). 


La recherche d’une solution numérique à l’intérieur d’un domaine D passe par la connaissance 
de cértains renseignements concernant la fonction ®, il s’agit des conditions aux limites 
(éventuellement à un instant t) : ce sont les conditions sur la frontière F du domaine D. Parmi 
les différentes manières d'imposer les conditions aux limites, nous évoquerons les deux plus 
importantes : 


a. Les conditions de Dirichlet (1805-1859). En tout point de la frontière F, nous connaissons 
la valeur de la fonction ®, c’est aussi le problème de Cauchy. 

b. Les conditions de von Neumann (1832-1925). En tout point de la frontière F du domaine, 
nous connaissons la valeur de la dérivée normale de la fonction ®. Généralement ce type de 
conditions conduit à utiliser une méthode d'intégration implicite. 


Remarque 1 : Les conditions aux limites peuvent dépendre du temps. Par exemple, il est 
possible d'étudier la propagation d’une perturbation thermique sinusoïdale dans un milieu 
matériel. 
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Remarque 2 : L’obtention de solutions générales aux différents types de problèmes présentés 
dépend de la nature de l’équation aux dérivées partielles, mais c’est surtout la forme géométrique 
de la frontière (qui possède ou non des propriétés de symétrie) qui permet de savoir si 
l’on doit s'orienter vers la recherche de solutions formelles ou vers la recherche de solutions 
numériques. 


2. Les opérateurs de différence 


Au domaine D on superpose donc un maillage le plus adapté possible à la forme géométrique 
de D. Quelle que soit la méthode utilisée, il faut pouvoir exprimer les opérateurs différentiels en 
fonction des différences fournies par le choix discret des points (nœuds du maillage). Ici, notre 
propos se limite aux opérateurs différence première et différence seconde, cependant, le cas 
échéant, la généralisation peut se faire sans difficulté, mais il est rare de rencontrer des dérivées 
partielles au-delà de deux. 

Dans un repère cartésien orthonormé à deux dimensions (x,y), on considère une fonction 
«bien élevée » (x, y) qui possède les bonnes propriétés de régularité (continuité, dérivabilité 
au moins à l’ordre trois, etc.). Soient trois points tous distincts A(ta, Ya), B(æv, yo) et Ce, Ye) 
pour lesquels nous avons : £a < Tp < Te, €t Ya < Yb < Ye. La dérivée partielle en B par rapport 
à x est approchée par l'opérateur différence première ainsi défini : 


d(x, Yb) 
Ôx 


sr 0x, Yb) 


Th ôx 


Pb, Yo) — Plta yo) | Prey) — (tr, Yo) 


MA 


£p Th — La Le — Th 


La dérivée partielle en B par rapport à y est donnée par l'expression : 


OP(xy, yo) 
Ôx 


_ 0B(m,y)| | Par ve) — P(T, Va) à (To, Ye) — (To, Yb) 


Y ôy p j Yb — Ya Ye — Y 


La dérivée partielle d'ordre deux par rapport à x, calculée en B, est approchée par lopérateur 
différence seconde ainsi défini : 


_ ô (P(T, y») 
za ÔT Ôx 


a (2E Yo) H P(T., Yo) (To, Yo) Ti Zew) 1 


P(T, ye) 
0x? 


Th 


Le — Tp To — Ta Ze — Lp 


la dérivée partielle d'ordre deux par rapport à y s’écrit : 


= 0 (=e) 
Yb ôy ôy Yb 


£ (20 — (£e, ye)  P(To, Yb) — 2ze e) ) l 
Yc — Yb Yb — Ya) Yc — Yb 


8’ P(T, y) 
3y? 


Il west pas très difficile de voir que, compte tenu des bonnes propriétés de la fonction ®, les 
opérateurs de différence tendent vers les opérateurs différentiels lorsque x; — x, tend vers zéro 
(ainsi que £e — £p) ou encore lorsque y, — Ya tend vers zéro (ainsi que Ye — Yo). 
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Dans le cas particulier où le maillage est régulier (points en progression arithmétique), on 
obtient des expressions plus simples en désignant par ôx et ôy les raisons des progressions 
arithmétiques : 


OB(x, yo) + (re, Yo) — (To, y) 


ðr Th Ôx 7 
OP(x»), Yo) S P(x, Yc) — S(T., Yo) 
ôx Yo ôy ’ 
D(L, y) | Pre Yo) — 20(%5, y) + D(a, yo) 
O2? læ ôx? p 
ODl y) Blz Ye) — 28 (z0, yo) + P(T, Ya) 
3Y? lm ĝy? 


Valeur de l'opérateur de différence sur les bords du domaine 


Il n’est pas toujours simple de faire coïncider les nœuds du maillage avec les bords du domaine 
quand bien même aurions-nous choisi un système de coordonnées correctement adapté au 
problème; alors nous sommes amené à calculer la valeur des opérateurs de différence sur les 
points qui sont à l'intersection du réseau formant le maillage et la ligne constituant le bord du 
domaine. Voyons ce qui se passe à deux dimensions (cf. Fig. 14.1). 


y 


bôy 


$] 
© 
D 
S 


Bord du domaine 


e 
D 
7 Figure 14.1. Valeur de opérateur de différence 


sur les bords du domaine. 


O’ 


Nous pouvons écrire : 


ôP i — o © _ Po — 
ôx loi aôt ’ rlo ôr ” 
ôP P; — o = _ Po — P4 


ôy lo3 bôy ” zla  ôy 
On en déduit que : 
E _ 2 (Bh, 2-a 
6x2 0  6x(1+a) aôx Ôx f 
Ce _ 2 (B-d, 8 
ôy2'0  õy(1 +b) bôy ôy ? 
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en généralisant sur la troisième dimension : 


8o 2 (SS | 2e) 


PAT 62(1 + c) côz  6z 


3. L'opérateur laplacien 


Compte tenu de son importance, il mérite qu’on s'arrête quelque peu sur lui et notamment que 
l’on donne son expression en fonction des opérateurs de différence dans le repère cartésien ainsi 
que dans les systèmes curvilignes orthogonaux classiques. 


3.1. Repère cartésien orthonormé 


z A 
Mi, j, k +1) 
° M(i T1, j, k) 
M(i, j- 1, kje e M(i, j +1, k) 
M(i, j, k) 
M(i + 1, j, k) ° 
M(i, J; k —1) 
êz 
O > 
ôy y 
ôx 


Figure 14.2. Repère cartésien 
orthonormé. T 


Désignons par ôx, ôy et ôz les dimensions de la maille élémentaire, l'orientation du maillage à 
trois dimensions étant définie conformément à la figure 14.2. Il vient immédiatement que : 


1 , . . . .. 
AB(x,y, 2)i,5k = Sz? [@(i + 1, j, k) H (i l,j, k) 2®(i, j, k)] 


Dhi j + 1,k) + D(i,j — 1,4) — 20 (à, j, k)] 


1 
sl 


1 o _. E 
+ zz [Pjk +1) + j,k- 1) — 28(i, j, k)]. 


219 


MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ 


Figure 14.3. Coordonnées cylindriques. 


3.2. Coordonnées cylindriques (r, 0, z) 


Désignons par ôr, r68 et êz les dimensions de la maille élémentaire (cf. Fig. 14.3). 


[@(i + 1, j, k) T (i, j, k)] T 2o [P(i a 1, j, k) = (i, j, k)] 


1 |2r,; + ôr 
APrig 28r? 


DART Ti 207? 


1 T es Ty 
F r;ô02 [S(i, j + 1,k) ay Sli, j m 1, k) Eg 28(i, j, k)] 


+ Ja [B(i, j,k +1) +8(i, j,k — 1) — B(i, j, k)] | - 


3.3. Coordonnées sphériques (r, 0, D) 


Désignons par ôr, rô et rô@ les dimensions de la maille élémentaire (cf. Fig. 14.4, page ci-contre). 


1 (2r; + ôr/2)? [$ (i + 1,3, k) Sa (i,j, k)] + (2r; = õr/2)? [EG — 1,5, k) T (4, 7, k)] 
AG;.,,0;,@k = 72 ôr2 


$ (i,j,k Ẹ 1) Ba (i, j,k E 1) si 2®(i, j, k) Ei sin (8j + 60/2) [E (i, j F 1, k) a (i,j, k)] 
sin? (0; )ðġ? sin(0; 602 


sin(0; — 60/2) [$ (i, j — 1, k) — ®(i, j, k)] 
sn 


4. Résolution des équations de type elliptique 
On se propose de calculer les valeurs d’une fonction ® obéissant à une équation de Poisson : 


AG(F) = p(T), 
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Figure 14.4. Coordonnées sphériques. 


avec T = OM, M appartenant au domaine D, connaissant les valeurs que ® prend sur la frontière 
F. 


Dans de nombreux cas p(T) = 0, et nous devons résoudre une équation de Laplace : 
AB(r)=— 0. 


Les fonctions qui obéissent à cette équation portent un nom, on les appelle fonctions 
harmoniques. La recherche de ces solutions dans le cas des symétries usuelles s’effectue sous 
la forme de produits de Laplace et elle aboutit à un bon nombre de fonctions dites spéciales, 
autrement dit celles qui jouent un rôle important en analyse : sinus, cosinus, fonctions de 
Legendre associées, fonctions de Weber-Hermite, de Bessel, de Neumann, de Mathieu etc. 

Dans le cas de l’équation de Poisson, nous connaissons une solution particulière : 


(r) — : Je dr, 


Ar) r 
D 
dr étant l'élément de volume. Il suffit d'ajouter cette solution aux solutions de léquation de 
Laplace (équation sans second membre) pour obtenir la solution complète (équation linéaire). 
Malheureusement, lorsque le problème étudié n’admet pas de symétries simples, les solutions 
formelles deviennent exceptionnelles et pratiquement dans tous les cas il faut avoir recours au 
calcul numérique. 


4.1. Conduite du calcul permettant la résolution numérique de l'équation de Poisson 


Par raison de simplicité, nous étudierons le problème dans un repère cartésien orthonormé et 
nous choisirons ôx = ĝy = ôz = h. 
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Maintenant, exprimons (i, j, k) au point M{i, j, k) en fonction des valeurs prises aux points 
plus proches voisins de M (4, j, k) : 


Dijk) = = [P+ 1, j,k) +8- 1,j,k) + (i,j +1, k) 


+ Bi, —1,k) + (à, 5, k +1) + Bi, 5, k — 1) — kpli j, k]. 


Ole 


4.2. Méthode de Jacobi (1804-1851) 


C’est une méthode itérative qui consiste à affecter aux nœuds du maillage une valeur arbitraire 
de l’ordre de grandeur de celles qui se situent sur la frontière. La dernière relation établie permet 
alors de calculer tous les points adjacents à la frontière, lesquels sont les seuls à être modifiés. 
La réitération de l'exploitation de la formule permet de proche en proche de modifier tous les 
points du maillage. On montre que la méthode est convergente. Au n° tour d’itération, on écrit 
les relations qui font appel aux calculs effectués au (n — 1)° : 


1 
P j, k) = [BCDE Lk) + EG 1j k) + BOIE +1, k) 
BOD (i, j — 1, k) + POD (i j,k +1) + DD (i j,k — 1) — hpl, j, k)]. 


D’un point de vue pratique, il faut deux tableaux pour mettre en œuvre cet algorithme. De 
toute façon, il west pas très utile de programmer cette procédure car la méthode de Gauss-Seidel 
en est une importante amélioration. 


4.3. Méthode de Gauss-Seidel (1821—1896) 


On peut montrer que la technique itérative de Jacobi est convergente et absolument convergente. 
Gauss et Seidel ont profité de cette propriété pour améliorer la méthode de Jacobi : au cours 
du calcul, on peut faire immédiatement usage des valeurs qui viennent d’être calculées et nous 
n'avons plus besoin de sauvegarder les différents tours d’itération. Nous n’avons plus besoin que 
d’un seul tableau dans lequel les valeurs sont «écrasées » successivement. Cette méthode exige 
environ deux fois moins de calculs que la méthode de Jacobi car elle converge beaucoup plus 
rapidement. 


4.4. Application 


On se propose d'étudier les équipotentielles d’une lampe triode que nous présentons assez 
simplifiée. Une lampe triode est constituée d’une cathode K, d’une anode À et d’une grille G4, 
Go, G3, Ga, Gs, Ge. La figure 14.5, page ci-contre montre la coupe de cette lampe simplifiée. 

L’anode À est un cylindre métallique de rayon 1 cm porté au potentiel 100 volts par rapport 
à la cathode qui se trouve au potentiel zéro. La cathode est un simple fil métallique de rayon 
négligeable placé sur laxe du cylindre de l’anode. La grille est constituée de six fils parallèles à la 
cathode disposés régulièrement sur le cylindre de rayon r = 0,2 cm, ces six fils étant maintenus 
au potentiel —5 volts par rapport à la cathode. On se propose de déterminer la carte du potentiel 
dans un plan perpendiculaire à l’axe de la triode. 

Pour ce faire, nous ferons usage des coordonnées polaires à cause de la symétrie cylindrique. 
Comme le problème admet une symétrie d'ordre six, nous n’avons donc besoin pour effectuer 
les calculs que de faire varier langle 0 dans l'intervalle (0,7/3) et nous compléterons ensuite 
par symétrie. 

Nous choisissons le maillage suivant : 60 = x/36 et ôr = 0,1 cm (cf. Fig. 14.6, page ci-contre). 
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Anode 
Figure 14.5. Représentation schématique 
d’une lampe triode. 
K 
Cathode 


Figure 14.6. Maillage d'une partie 


du domaine de la triode. 


4,5. Technique opératoire 


On met des zéros partout aux nœuds du maillage hormis aux points À, G1 et K. Nous calculons 
le potentiel sur les droites Dı, D2, D3 et D4. Nous complétons par symétrie car sur la droite 
D; le potentiel est le même que sur la droite D3, et celui de la droite Do est le même que celui 
de la droite Də. Nous avons donc besoin d’un tableau contenant 88 valeurs et nous arrêtons 
les calculs quand deux valeurs calculées au même point au centre du maillage, lors de deux 
itérations consécutives, sont égales à une certaine précision près. 

On trouvera sur le Web ©) le programme triode.c qui réalise le calcul des potentiels par la 
méthode de Gauss-Seidel. 


*http://www.edpsciences.com/guilpin/ 
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5. Résolution des équations de type parabolique (méthode explicite) 


Nous recherchons une fonction ® qui prend certaines valeurs sur le bord d’un domaine et qui 
obéit à l’équation suivante : 

AD = Lor 
D ðt 
expression dans laquelle D est une constante appelée coefficient de diffusion thermique. Ici la 
fonction dépend des trois variables d'espace x, y, z et de la variable de temps t. Pour étudier 
l'intégration de cette équation, nous ne conserverons qu’une seule coordonnée d'espace, x par 
exemple, sans pour autant nuire à la généralité. L’équation se réduit : 


(r,t) 188 
ðz Dat 
5.1. Maillage pour une coordonnée d'espace et la coordonnée de temps 


Comme précédemment, nous choisissons un maillage régulier, et la maille élémentaire a la taille 
ôxôt. Nous pouvons écrire : 


PE(x,t)| _ (x+ ôx, t)+8(x-— ôr, t)—28(x,t) 
Da? lee ôx? ? 
OP(x,t)| (x,t +t) — D(x,t) 
ot Pe ôt l 


Au moyen des différences finies, l’expression de léquation devient : 


2 
P(x + ôx, t) +(x — ôr, t) — 2D(x,t) = 2 [B(x,t + ôt) — P(x, t)]. 


5.2. Conduite du calcul pour obtenir la résolution approchée de l'équation de diffusion 


Les valeurs en chaque point du maillage au temps t + dt ne dépendent que des valeurs calculées 
à l'instant t. La solution du problème est déterminée par une suite d'opérations élémentaires 
effectuées à partir des conditions initiales, et il est facile de s’apercevoir que cette méthode n’est 
pas itérative (les valeurs changent au cours du temps) : 


P(x,t + åt) = (x,t) + p% [E(x + ôx, t) + D(x — ôx, t) — 2D(x,t)]. 


Au temps t = 0, nous connaissons la valeur de & en tout point du maillage. Au temps ôt, nous 
calculons au moyen de la relation ci-dessus les valeurs en chaque point du maillage, en tenant 
compte des conditions imposées au système étudié (conditions aux limites). Puis nous effectuons 
les calculs au temps 2ôt par le même procédé, et ainsi de suite au temps 3ôt,...,nôt,... Nous 
obtenons alors l’évolution du système au cours du temps. 


5.3. Problème de stabilité 


Nous ne pouvons pas choisir n'importe comment le quadrillage de l’espace (x,t) et le calcul 
proposé est stable lorsque la condition suivante est remplie : 


ôx? 
ôt < aD’ 
a valant 2, 4 ou 6 selon qu’il y a une, deux ou trois coordonnées d'espace. 
Le non-respect de la condition de stabilité est sanctionné immédiatement : on obtient très 
rapidement n'importe quoi : on aboutit à un dépassement de capacité (overflow) qui produit un 
arrêt de la machine. 
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5.4. Application : Refroidissement d’une plaque homogène 


Une plaque homogène d'épaisseur { = 10 cm est portée à la température uniforme ĝo = 90 °C. Au 
temps t = 0, elle est plongée dans un réservoir d’eau à la température #, = 10 °C suffisamment 
grand et bien agité pour que l’on puisse admettre que l'énergie cédée par la plaque ne change 
pas de façon notable la température du réservoir. On se propose de déterminer la température 
à l’intérieur de la plaque en fonction de la distance x et du temps t (on notera la symétrie du 
problème). La plaque est en cuivre dont le coefficient de diffusion est D = 1,12 em?s !, Au 
bout de combien de temps pouvons-nous admettre que la température est à nouveau uniforme 
dans la plaque, c’est-à-dire lorsque la température la plus élevée ne dépasse que de 0,1 °C la 
température du thermostat ? 

Il est tout à fait intéressant de comparer les résultats du calcul numérique avec les résultats 
du calcul formel. C’est ce genre de problème que Fourier a traité et pour lequel il a trouvé la 
solution sous forme d’un développement en série de sinus et de cosinus qui, aujourd’hui, porte 
son nom (Théorie analytique de la chaleur, 1822). 

On trouvera sur le Web (*) Je programme chaleur.c qui traite ce problème. 


6. Résolution des équations de type hyperbolique (méthode explicite) 


Nous recherchons une fonction $ qui prend certaines valeurs sur le bord d’un domaine et qui 
obéit à l'équation suivante : 


1 62 
e Ot? ? 


expression dans laquelle c est une constante appelée célérité de londe libre dans le milieu 
considéré (vitesse de phase). 

La fonction dépend des trois variables d’espace x, y, z et de la variable de temps t. Comme 
précédemment, pour étudier l'intégration de cette équation, nous ne conservons que la seule 
coordonnée d’espace +. L’équation se réduit alors à l’expression : 


A? = 


PE(x,t) 1029 


O2 CO. 


6.1. Maillage pour une coordonnée d'espace et la coordonnée de temps 


Comme précédemment, nous choisissons un maillage régulier, et la maille élémentaire a la taille 
ôxôt. Nous pouvons écrire : 


P(x, t); _ D(x+6x,t) + P(x — ôx, t) -28(x,t) 
ðr? rt ôx? | 

DE(x,t)| _ D(x,t+ôt) + B(x,t—0ôt) —2D(x,t) 
ot? zt Gi ôt? 


Au moyen des différences finies, l'expression de l'équation devient : 
2 


(x +06x,1) + B(s — öx, t) — 28(x2,t) = -zya 


[B(x,t + ôt) + (x,t — ôt) — 28(x,t)]- 


*http://www.edpsciences.com/guilpin/ 


225 


MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ 


6.2. Conduite du calcul pour obtenir la résolution numérique de l'équation de propagation 


Les valeurs en chaque point du maillage au temps t+0t ne dépendent que des valeurs calculées à 
l'instant t et à l'instant t— ôt. La solution du problème est déterminée par une suite d'opérations 
élémentaires effectuées à partir des conditions initiales, et l’on voit ici encore que cette méthode 
n’est pas itérative : 


D, t + ôt) = r P(x + ôx, t) + rD(x — ôr, t) + 2(1 — r?)D(x,t) — (x,t — ôt), 


expression dans laquelle on a posé : 
I 
2 
2 ÔT 


| &ôt? 

Au temps t < 0, nous connaissons la valeur de £ en tout point du maillage. Au temps ôt, nous 
calculons au moyen de la relation ci-dessus les valeurs en chaque point du maillage, en tenant 
compte des conditions imposées au système étudié. Puis nous effectuons les calculs au temps 
2őt au moyen de ce qui s’est passé au temps t = 0 et au temps t = ôt, et ainsi de suite au temps 
3ôt,...,nôt,... Nous obtenons par ce moyen l’évolution du système au cours du temps. 


6.3. Problème de stabilité 


Ici encore, nous ne pouvons pas choisir n’importe comment le quadrillage de l’espace (x,t) et 
l'algorithme proposé est stable lorsque la condition suivante est remplie : 


ôr? 
2 
Ea 
a valant 2, 4 ou 6 selon qu’il y a une, deux ou trois coordonnées d’espace. 
Ici encore, le non-respect de la condition de stabilité provoque l’arrêt quasi immédiat de la 


machine. 


Application : Profil d'une corde vibrante pincée — Une corde vibrante ABC est fixée à ces 
deux extrémités B et C, et, à l’instant initial t = 0, cette corde est disposée conformément à la 
figure 14.7. 


y 


B g L C 2 Figure 14.7. Profil d’une corde pincée. 


Sachant que L = 100 cm, h = 1 cm, c = 300 ms! et a = 15 cm, on se propose de déterminer 
les profils successifs de la corde sur une demi-période. On note que l’on doit retrouver un profil 


226 


14. INTÉGRATION DES ÉQUATIONS AUX DÉRIVÉES PARTIELLES 


symétrique au profil initial. On observera aussi la propagation des ébranlements de chaque côté 
du point À. 

Sur le Web @), on donne le programme corde.c qui réalise la simulation d’une corde pincée. 
Il est intéressant de comparer les résultats avec ceux fournis par la solution analytique. 
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15 | Les séries de Fourier 


Les séries de Fourier jouent un rôle important en calcul numérique, et on les retrouve lors des 
problèmes d’approximation des fonctions, de lissage, d’interpolation et aussi dans les problèmes 
de filtrage numérique. En toute rigueur le calcul pratique des séries de Fourier n’est pas à 
dissocier du calcul des transformées de Fourier, et nous aborderons l’étude du très puissant 
algorithme de Cooley-Tukey. On se bornera donc ici à étudier les fonctions périodiques de 
période 2r puisqu’un changement linéaire de variable permet toujours de se ramener à ce cas. 
Cependant on pourrait tout aussi bien s’intéresser aux fonctions périodiques de période 2, c’est- 
à-dire dans l'intervalle (—1, +1), dans la mesure où l’on souhaiterait étudier en même temps les 
développements en série de Tchebycheff. 

Au cours de ce chapitre, on se contentera de rappeler un certain nombre de théorèmes 
fondamentaux dont on omettra la démonstration. 


1. Petit aperçu historique 


L'origine des séries de Fourier remonte à 1822 quand est paru l’ouvrage de Jean-Baptiste-Joseph 
Fourier (1768-1830) sous le titre « Théorie Analytique de la Chaleur ». C’est en résolvant «le 
problème du mur » en régime transitoire que Fourier a fourni une expression formelle constituée 
d’une somme trigonométrique infinie. Il est intéressant de rappeler ici les grandes lignes de ce 
problème ainsi que sa solution. On recherche donc la solution de l’équation de la chaleur dans 
un milieu homogène et isotrope constitué par un mur indéfini d'épaisseur h. On désigne par D 
le coefficient de diffusion thermique dans le milieu, par 4 la température, par x la seule variable 
spatiale et par t la variable temporelle. Il convient alors de résoudre l’équation : 


#0 _ 100 
ðr? D ôt 
Posons @{(x,t) = X(x) - T(t) afin de rechercher les solutions sous la forme de produits de 
Laplace. Nous obtenons : 


(15.1) 


DX” (x) T(t) = X(x) T(t) 
d’où l’on tire : 
X") _ TE), 
X(z) Tt) 


(15.2) 
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Comme le premier membre de (15.2) est constitué d’une fonction ne dépendant que de x et 
comme le second membre est constitué d’une fonction ne dépendant que de t, leur intersection 
commune ne peut être égale qu’à une constante que l’on désigne par —k?. Comme on va le voir 
le signe moins résulte du fait physique que la température ne peut pas croître indéfiniment de 
façon spontanée. On obtient alors les équations : 


X"(x)+k?X(x) = 0, (15.3) 


T'(t) + kT) = 0. (15.4) 

Maintenant, pour déterminer complètement la solution il est nécessaire de faire intervenir les 
conditions initiales et aux limites. 

Au temps t < 0, T = T; pour 0 < x < h et T = To partout hors du mur. 

Au temps t = 0, on a T = To sur les parois du mur c’est-à-dire pour x = 0 et x = h. Les 
solutions des équations (15.3) et (15.4) s'écrivent : 

T(t) = A'exp(—-kDt) X(x) = B'cos(kx) + C'sin(kx), 

A', B' et C' étant des constantes d'intégration. Une solution de (15.1) s'écrit : 


O(x,t) = [A cos(kx) + B sin(kz)]exp(—k?° Dt), (15.5) 


expression dans laquelle A et B sont des constantes, ce sont des combinaisons linéaires des autres 
constantes A’, B’ et C”. Il reste à appliquer les conditions aux limites et les conditions initiales : 


8(0,t > 0) = 6(0,0) = To = À, 
O(h, t > 0) = 8(h,0) = To = Acos(kh) + Bsin(kh). 


Pour simplifier les équations, on peut réaliser un changement d’origine des températures et 
poser : 


6=0-T 
To est la nouvelle référence, et l’on obtient : 


A=0 
0 = Bsin(kh). 


La solution non triviale impose : 


kh=nr avec n=0,1,2,3..., 


donc k= ni avec n =0,1,2,3,..., 


et l'expression (15.5) s’écrit alors : 
. (N7 nT\?2 
(x,t) — To = Bsin (+) exp |— (=) Dti. 
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Il ne reste plus qu’à déterminer le coefficient B, et, en toute rigueur, B dépend de n. Compte 
tenu de la linéarité de l’équation (15.1), la solution la plus générale doit donc s’écrire : 


co 2 
B (NT 2T 
— To = 2, En sin (Fa) exp (-Dn Te) s 
On remarque qu’à l'instant t = 0 : 0(x,0) — To = T; — To = T} pour 0 < x < h donc : 
kad (NT 
= 2 Bn sin (Zr) . (15.6) 


Multiplions les deux membres de (15.6) par sin (Hz 


h h 
J T; sin (Fe) ) de = = Ba f sin? ) dx 
0 0 


à cause de l’orthogonalité des fonctions sinus (voir le prochain paragraphe). Le membre de 
gauche est différent de zéro quand n est impair soit n = 2p + 1, quant au membre de droite, il 
vaut h/2. On déduit donc la solution générale : 


et intégrons de 0 à h. On obtient : 


TE 1. T 
O(x,t) — To = 4 TÈ Di sin [(2p+ Da] exp |-D6r +1) FE mil. (15.7) 


D'une façon plus générale, si au temps t < 0, la condition dans le mur s'écrit F'(x) pour x 
compris entre 0 et h, alors la condition (15.6) prend la forme : 


= VE sin (a) | (15.8) 
n=1 


La somme est le développement de F(x) en série de sinus, les propriétés de parité ou de 
symétrie ayant annulé les coefficients des termes en cosinus. 

En définitive, la solution spatiale est donnée par le développement de la condition initiale 
dans le mur (ici, c’est la fonction «fenêtre » qui est une constante dans un intervalle fini et qui 
est nulle ailleurs). 


2. Orthogonalité des fonctions sinus et cosinus sur une période 


Il s’agit de calculer les expressions suivantes : 


27 

K = f| sin(nx)sin(mx) dx 
0 
2x 

L= | sin(nx) cos(mx) dx 
0 
2x 

M = J costne) cos(ma) dz. 
0 


231 


MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ 


Pour cela on utilise les formules usuelles de trigonométrie à savoir : 


sin(a + b) = sin(a) cos(b) + sin(b) cos(a) 
sin(a — b) = sin(a) cos(b) — sin(b) cos(a) 
cos(a + b) = cos(a) cos(b) — sin(a) sin(b) 
cos(a — b) = cos(a) cos(b) + sin(a) sin(b) 


qui nous permettent d'obtenir : 
sin(a) cos(b) = [sin(a + b) + sin(a — b)] /2 
cos(a) cos(b) = [cos(a + b) + cos(a — b)] /2 
sin(a) sin(b) = [cos(a — b) — cos(a + b)] /2. 


L'intégration des expressions K, L et M au moyen des relations précédentes fournit les égalités 
suivantes : 


K = Tômn 
L=0 
M = nmn 


3. Série de Fourier associée à une fonction périodique 


On s'intéresse à une fonction f(x) périodique de période 27, à laquelle on associe la série 
trigonométrique : 


a -00 0o | 
à + >, An cos(nx) + >. bn sin(næ), 
= n= 


susceptible de représenter la fonction f(x) dans l'intervalle (0, 27). Supposons que nous ayons 
l'égalité : 


ao 
= + Dm cos(nx) + D sin(nx) (15.9) 


nous préciserons ultérieurement les conditions pour que la fonction et le développement trigo- 
nométrique proposé soient égaux mais, pour l'instant cherchons à calculer les coefficients a, et 
bn. Pour cela, multiplions les deux membres de la relation (15.9) par cos(kx) et intégrons sur la 
période : 


27. 27 So 
fto cos(kx) dx = T S + X lan cos(ng) + bn sin(nx)] cos(kx) dz, 
0 0 nal 
et en tenant compte des relations d’orthogonalité, on obtient : 
1 27 
ak = JE cos(kx) dz; (15.10) 
T 
0 
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et, comme 


27 
1 
ao = 37 f Fa) de, 
0 


ceci explique l’origine du coefficient ap/2 : tous les ax sont calculés au moyen de la même formule. 
De la même façon, multiplions les deux membres de la relation (15.9) par sin(kx), puis 
intégrons sur une période; en tenant compte des relations d’orthogonalité, on obtient : 


27 
1 
bx = — | f(x)sin(kx) dz. (15.11) 


4. Conditions d'égalité de f(x) et de la série de Fourier associée 


On admettra sans démonstration les théorèmes suivants : 


4.1. Théorème | 


Si f(x) est une fonction périodique de période 27, continue et pourvue d’une dérivée première 
continue f'(x), sauf éventuellement en un nombre fini de points sur une période et qui sont alors 
des points de discontinuité de première espèce pour f(x) et f'(x), la série trigonométrique (15.7) 
est convergente pour tout x et a pour somme f(x) dans le cas de la continuité et [f(x + 0) + 
f(z — 0)]/2 dans le cas de la discontinuité (convergence simple). 


4.2. Théorème II 
Le théorème I est conservé si f(x) est à variations bornées sur un intervalle de période 27. 


Définition d'une fonction à variations bornées — Soit f(x) une fonction définie sur un 
intervalle (a,b). On divise (a,b) en n sous-intervalles partiels au moyen de (n — 1) points tels 
que : 

a < £1 < £2 < T3 <- <En_1 < b, 


soit S la somme définie par : 


Sn = |f (21) — f(a)| + |F (£2) — F (£1) +: +10) — f(£n-1)l- 


Si, quelle que soit la décomposition de (a,b), la somme Sn reste inférieure à un nombre M 
fini, on dit que la fonction f(x) est à variations bornées sur (a, b). 


4.3. Théorème III 


Appelé théorème de Jordan (1838-1922). Si f(x) est périodique de période 27, et à variations 
bornées sur tout intervalle fini, alors sa série de Fourier est convergente et uniformément 
convergente dans tout intervalle où f(x) est continue. 
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5. Quelques propriétés remarquables 


5.1. Sur la vitesse de décroissance des coefficients a, et bn 


Si la série trigonométrique est convergente, alors an et bn tendent vers zéro au moins comme 
1/n, cependant, la convergence de la série peut être très lente. 

Si la série trigonométrique est convergente et uniformément convergente, a, et bn tendent 
vers zéro comme 1/n?, f(x) est alors continue partout sur une période. 

Réciproquement, si f(x) n’est pas continue, l’un au moins des coefficients tend vers zéro 
comme 1/n. 


5.2. À propos du théorème de Jordan 


Si les conditions du théorème de Jordan sont vérifiées, alors la série de Fourier est intégrable 
terme à terme. À propos de ce théorème, on peut se poser la question de savoir si toutes les 
fonctions continues sont développables en série de Fourier. La réponse est non. En effet, toutes 
les fonctions continues ne sont pas à variations bornées et l’on peut trouver des exemples de 
fonctions continues dont la série trigonométrique associée diverge en un point parce que la 
fonction n’est pas à variations bornées. 


5.3. Sur la parité des fonctions f(x) 


Si f(x) est une fonction paire, la série trigonométrique associée n’admet qu’un développement 
en cosinus (fonction paire), les coefficients des termes en sinus sont nuls. 

Si f(x) est une fonction impaire, le développement ne comprend que des termes en sinus, et 
tous les a, sont nuls. 


5.4. Dérivabilité d’une série de Fourier 


Si f(x) et f'(x) possèdent des discontinuités de première espèce en nombre fini sur l’intervalle 
(0,27), et sont continues ailleurs, alors f(x) est développable en série de Fourier, mais la série 
converge lentement ; l’un des coefficients an ou bn tend vers zéro avec 1/n et la série dérivée 
ne converge pas. En revanche, si f'(x) et f” (x) existent et sont continues sauf éventuellement 
en un nombre fini de points dans l'intervalle (0,27) où il existe pour ces deux fonctions des 
discontinuités de première espèce, alors, on peut calculer directement un développement de 
f'(x) en série de Fourier. 


Remarque : Deux séries de Fourier dont les sommes coïncident sur un intervalle intérieur à une 
période, ne sont pas nécessairement identiques en dehors de cet intervalle. 


5.5. Quelques développements traditionnels 


a — Soit la fonction paire de période 27 définie ainsi : 


f(x)=7r- x si 0 <xr<7r 
f&)=x-7 si —H<& < 0. 


Comme f(x) est une fonction continue et paire, on en déduit immédiatement que les 
coefficients bn sont nuls. Il reste à calculer les a, : 


27 
An = 2 fe — æ)cos(nx) dx. 


T 
0 
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Les termes correspondant à une valeur de n pair sont nuls, il s'ensuit que : 


4 


avec p = 0,1,2,... On trouve ag = 7. 


b — Soit la fonction f(x) = x — 1/2 si 0 < x < 1. 
On obtient le développement suivant : 


f(æ) — 


a ) : pi = 


1 pes _sin(4ræ)  sin(2nrx) +). 


c — Soit la fonction qui vaut 1 sur (0,7) et —1 sur (—r, 0). 
Cette fonction est impaire, donc les a, sont nuls. On trouve : 


E. 
PH O (2p 1) 


d’où 


fe) = = 


T 


t(D mE y etie e) 


1 3 (2p + 1) 


La dérivée de ce développement n’est pas un développement convergent, cependant on pourra 
l'utiliser quand même pour calculer f'(x)... (cf. $8.2 de ce chapitre). 


5.6. Note sur le calcul effectif des coefficients de Fourier 


Il n’est pas nécessaire de calculer les coefficients de Fourier au moyen des intégrales, et il est 
plus efficace sur le plan de la précision des calculs ainsi que du temps d'exécution d’utiliser la 
transformée de Fourier numérique que l’on abordera au chapitre 16. Donc, il n’est pas utile de 
fournir un programme qui calculeraïit directement les intégrales. 


6. Approximation des fonctions par une série de Fourier tronquée 


La première application des séries de Fourier concerne l'approximation d’une fonction f(x). 
Le développement alors est limité à l’ordre n. La démonstration repose sur le théorème 
d’approximation de Weierstrass selon lequel toute fonction continue sur l'intervalle (a,b) peut 
être approchée par un polynôme P,(x) tel que : 


f(x) — P(x)l < € 
quel que soit z appartenant à (a,b). Dans cette expression € est un nombre positif aussi petit 


que l’on veut. On trouvera une démonstration complète dans l’ouvrage de J. Bass, Cours de 
Mathématiques, Tome I, p. 312, Masson, Paris 1961. 
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6.1. Théorème 


Si l’on veut approcher au sens des moindres carrés une fonction f(x) définie sur (a,b) par 
une série trigonométrique et que cette série est tronquée à l’ordre n, alors les coefficients 
du développement trigonométrique sont égaux aux coefficients du développement en série de 
Fourier. 


Bien entendu ce théorème est valable sous réserve que les conditions de validité de dévelop- 
pement en série de Fourier soient vérifiées. Autrement dit, le développement en série de Fourier 
tronqué à l’ordre n est celui qui, parmi tous les développements trigonométriques possibles 
tronqués à l’ordre n, assure la meilleure approximation, au sens des moindres carrés, d’une 
fonction développable en série trigonométrique. 


Nous allons démontrer cette proposition dans le cas d’une fonction échantillonnée. 


Approximation d'une fonction échantillonnée — Considérons une fonction f(x) périodique de 
période 27 dont on connaît uniquement 2N +1 valeurs yg, pour 2N +1 valeurs zx de la variable. 
Les 2N +1 valeurs de la variable sont réparties en progression arithmétique sur toute la période, 
soit : | 


N —-1 T 0 T N-—i 
Tours NON N 


NT. 


Comme f(x) = f(—r), seules 2N valeurs f(x) sont indépendantes. On a posé : 


Ti = avec l=-N+1,-N+42,...,—1,0,+1,...,N. 


T 
—l 
N 
Nous allons donc approcher f(x) par une expression trigonométrique dont la forme la plus 
générale est : 

f(x) = Ao + >. [Ax cos(kx) + Br sin(kx)] avec n< N, 
k=1 


de telle sorte qu’elle vérifie le critère des moindres carrés. Autrement dit, on désire rendre 
l'expression : 


N n 2 
E? = 5 fre — Áo — Y [A cos(kx) + Bk ant} (15.12) 
I=-N+H k=1 


la plus petite possible. On y parvient en écrivant que : 


Pour obtenir des expressions commodes d’emploi, il faut utiliser un certain nombre de relations 
trigonométriques qui s’établissent en se servant de la formule de Moivre (1667-1754) et de 
l'expression de la somme d’une progression géométrique. Voici ces relations dans lesquelles j et 
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k sont des entiers appartenant à (0, N) : 


N 
>D sin(jx) cos(kxı) = 0 
I==N+1 
N 
XO sin(jn)sin(kæ) =0 si j#k 
==N+1 
N 
De cos(jæi) cos(kzı) = 0 si j Æk 
I1=-N+1 
N N 
D» sin(kz) = 5 cos(kzıi) =N si k#0,N 
I1=-N+1 I=-N+1 
N 
> cos( Nz) = 2N 
l=-N+1 


N f 
0 si m£2vN 
X cos(mz) = | 7 où v est un entier quelconque. 
EENAA 2N si m=2wN 


N 


5 sin(mz) = 0. 


I=-N+i 


Compte tenu de ces relations, on calcule les dérivées de l'expression (15.12) par rapport aux 
coefficients Ap et Bp. On obtient alors les relations suivantes : 


LE LE 
An X Fa) AN = 3N YO f(x) cos(Nz:) 


=-N+ I=-N+H 


et si k £0, N 


N N 
Ag = + 5 f(z) cos(kx;) Bx = 5 y f(z) sin(kx). 
I=-N+ = NH 


On reconnaît sans grande difficulté les coefficients du développement en série de Fourier 
calculés par la méthode des rectangles. 


Remarque très importante — Lorsque l’on effectue le calcul numérique des coefficients de 
Fourier de fonctions périodiques, on est tenté d'utiliser des méthodes offrant en apparence plus 
de précision, telles, par exemple, la méthode des trapèzes ou la méthode de Simpson. À bien y 
réfléchir, ces méthodes privilégient certains points en leur affectant des poids différents, mais on 
ne doit pas perdre de vue que le calcul de toutes les intégrales peut être réalisé sur n'importe 
quel intervalle pourvu qu'il ait la longueur d’une période. Conclusion, nous devons utiliser une 
méthode qui affecte à chaque point le même poids : il n’y en a qu’une seule, c’est la méthode 
des rectangles. 

On retrouvera rigoureusement le même procédé lors du calcul des transformées de Fourier par 
les algorithmes appropriés. 
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Un exemple numérique — On a fabriqué une dent de scie tout à fait analogue à la première 
fonction développée, et il est intéressant de noter le comportement de l’approximation au 
voisinage de la discontinuité de la dérivée première. On a tronqué la série trigonométrique à 
l’ordre 10. 

On trouvera sur le Web (*) le programme echantil.c réalisant la décomposition en série de 
Fourier de fonctions périodiques connues au moyen d’un échantillonnage déterminé selon des 
abscisses en progression arithmétique. 


7. Cas où la fonction est discontinue à l'origine 


Dans ce cas, la notion de périodicité au sens strict ne s'applique plus, cependant, cela ne change 
rien à l’analyse précédemment réalisée; en effet deux solutions peuvent être apportées à ce 
problème : 

1. On choisit comme nouvelle origine un point où la fonction est continue ; ainsi il n’y a plus de 
discontinuité à l’origine et ce faux problème a disparu. 

2. On sait très bien obtenir le développement en série de Fourier des fonctions en dent de scie 
présentant une discontinuité à l’origine. Par conséquent, il suffit de retrancher convenablement 
une fonction en dent de scie qui annule la discontinuité. En faisant usage de la propriété de 
linéarité des intégrales, on déduit que le développement en série de Fourier de deux fonctions 
développables est la somme de chacun des deux développements ; ce qui résout notre problème. 


8. Le phénomène de Gibbs (1839-1903) et l’epsilon-algorithme 


Il s’agit d'étudier le comportement du développement en série de Fourier de la fonction f(x) 
au voisinage d’un point de discontinuité. Nous allons nous intéresser à un cas très classique 
constitué par la fonction «rectangle » ou fonction «fente » : 


és —1 si -r<r<0 
I +1 si 0<x<7 


dont nous avons déjà établi le développement en série de Fourier, soit : 


_ 4 (sin(x)  sin(3x) _ sin[2(p + 1)z] 
fa) = À Ed de dou +). 


Bien que g(x) tende vers +1, le développement associé f(x) qui est continu tend vers zéro 
pour la valeur z = 0. À présent nous allons étudier le comportement de f(x) au voisinage de 
zéro. Pour cela, considérons le développement tronqué à l’ordre n de f(x) que nous désignons 
par $,(x) : 


_ 4 (sin(x) sin(3x) sin[2(n — 1)x] 
Sa(x) = ( 1 ag 3 Fe PAT). 


On peut encore écrire : 


F Sala) = fist + cos(3t) + -+ + cos|(2n — 1)t]} dt, 
0 


* http://www.edpsciences.com/guilpin/ 
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et puisque 


cos(t) + cos(3t) + --- + cosf(2n — 1)f] = a 


on obtient : 


Ts, (e) 2 IE d 
0 


2sin(t) 
Les extremums de $,(x) sont donnés par sin(2nx) = 0. Soit encore : 
T 
£k = — avec k—=1,2,3,...n. 


La courbe représentant S,(x) va effectuer une série d’oscillations pour un point z quelconque 
choisi dans le voisinage de l’ordonnée y = 1. On voit sans trop de difficulté que le premier 
maximum est le plus grand ; pour le calculer on peut écrire : 


n/2n 


T 
2 f re) dt = 2 Î sin(u) du 
T 2sin(t) m J 2nsin(u/2n) 
0 0 
en ayant posé u = 2nz. 


Pour les grandes valeurs de n et les petites valeurs de x, on peut effectuer un développement 
limité de sin(u/2n) et remplacer cette expression par u/2n. Ainsi quand n tend vers l'infini et 
æ vers zéro, on obtient : 


K 
2 fsin(u 2): 
— I w du = —Si(r), 
T u T 
0 
où Si(x) est la fonction sinus intégral que l’on peut calculer au moyen du développement en 
série entière suivant : 


grt! 


(On + 1)!(2n +1 


Si(x) = $ HET 


11 313 515 an 


La fonction représentée par la série trigonométrique fait un saut brusque dépassant de 17 % 
la valeur de g(x). Plus on prend de termes, plus cette anomalie se trouve repoussée sur laxe 
des y. 


8.1. Usage de l'epsilon-algorithme et disparition du phénomène de Gibbs 


Nous allons appliquer l’epsilon-algorithme à la suite des sommes partielles S, (x). Nous avons 
considéré les termes depuis S71 jusqu’à Sgs pour la valeur x = 0,1 de l'argument. Les résultats 
trouvés sont présentés dans le tableau 15.1, page suivante. 

L'epsilon-algorithme appliqué à ces quinze valeurs donne le résultat suivant : 


0,999 998 031 


On voit que l’epsilon-algorithme fait disparaître le fâcheux phénomène de Gibbs et les 
incessantes oscillations au voisinage d’un point de discontinuité. 
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Tableau 15.1. 


0,990 709 731 
0,999 733 562 
1,008 519 556 
1,016 728 834 
1,024 054 265 
1,035 047 814 
1,038 349 421 
1,040 045 437 
1,038 581 660 
1,035 560 117 
1,025 708 447 
1,019 325 920 


Sur le Web®), on donne le programme epsil2.c qui montre ce genre de calcul. 


Remarque : Le phénomène de Gibbs n’est pas propre au développement d’une fonction 
présentant une discontinuité de première espèce sur une base de sinus et de cosinus. Le problème 
est inhérent à chaque point de discontinuité quelle que soit la base de fonctions continues utilisée 
et le développement continu ne peut en aucun cas représenter convenablement une discontinuité. 
Il n’en est plus de même si la base des fonctions (orthogonales si possible) est constituée de 
fonctions discontinues telles que les fonctions de Hadamard, Walsh, Paley et de Haar. Les 
points de discontinuité ne sont plus la source d’oscillations, et les fonctions échantillonnées 
sont parfaitement rendues. 


8.2. Retour sur les fonctions f(x) présentant des discontinuités 


Nous avons dit que la fonction f(x) admettait un développement en série de Fourier mais 
qu’au moins une série de coefficients (a, ou bn) tendait vers zéro comme 1/n. Si l’on dérive 
chacun des deux membres, on voit que le seconde membre est une série divergente puisque 
c’est une série de terme en cos(kx) ou sin(kx). L’epsilon-algorithme tire néanmoins parti de ces 
données en calculant les sommes partielles de la série divergente. Nous avons pris pour exemple 
la fonction qui vaut —1 pour x appartenant à l'intervalle (—7,0) et +1 pour x appartenant à 
l'intervalle (0, x) : 


ft) = 4 (= R sin(3x) no sin[2(p + 1)x] Je +) 


T 1 3 (2p +1) 
la dérivée s'écrit : 
4 
f'{æ) = z {cos(x) + cos(3x) +- -- + cos[2(p + i)e] +---} 


le membre de droite est divergent alors que le membre de gauche est nul partout sauf aux points 
gz = =T, £ = l et x = 7 où f'(x) est un pic de Dirac. C’est bien ce que donne l’epsilon-algorithme, 


*http://wuw.edpsciences.com/guilpin/ 
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et l’on trouvera sur le Web (*) le programme dirac.c qui permet de calculer f'(x) en exploitant 
le développement en série. 


9. Représentation des séries de Fourier avec un terme de phase 


Dans bien des applications, et notamment en électricité, il est souhaitable d'utiliser une autre 
forme pour le développement en série de Fourier (qui rend plus facile d'emploi la notion 
d’impédance par exemple). On peut alors préférer conserver uniquement ou les sinus ou les 
cosinus et faire apparaître à l’intérieur des expressions un terme de phase, soit : 


©OQ OO 


f(x) = - + 5 dn COS(nT — Pn) = % + 5 dn [cos(næ) cos(pn) + sin(ng) sin(w,)]. 


n=1 n=1 


En rapprochant cette expression du développement (15.9), nous obtenons par identification : 


ao = do An = dn COS( Pn) bn = dn Sin(@n) dn = (signe de a)y/an2 + b,2. 


10. Écriture du développement sous forme complexe 


Comme c’est à partir de cette étude que nous allons établir les transformées de Fourier, nous 
procéderons d’abord à l’extension de la période que l’on désigne par T au lieu de 27. En posant 
w == 2r/T, la série s'écrit alors : | 


z ao OO [e9] f 
f(x) = z + 2 an cos(nwx) + D bn Sin(nwt), (15.13) 


et les coefficients deviennent : 


f(z) cos(nwgs) dz ; 


f(æ)sin(nwx) dz. 


À présent, écrivons les cosinus et les sinus en termes complexes : 


exp(inwx) + exp(—jnwx) 
2 3 

exp(jnwgr) — exp(—jnwx) 
2j ? 


cos(nwg) = 


sin(nwz) = 


ce qui donne pour f(x) l'expression : 


ao a exp(inwr) + exp(—jnwz) 5% exp(jnwx) —exp(-inwz) 
PE A 2 É 2j 


n=1 n=l 


f(z) = 


* http://www .edpsciences .com/guilpin/ 
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Soit encore : 


ao ies an — J0n . © An + jon 5 
fa) =- Y 2 exp(jnwz) + 5 S exp(—jnwr). (15.14) 


n=] n=1 


Les coefficients sont alors donnés par les expressions suivantes : 


T 
e 1 
en Je j f{æ)[cos(nwx) — j sin(nwx)] dz = T J f(x) exp(—jnwx) dx 
0 


1 
mtii 2 fie Jexp(inwx)) dz. 
0 


Si l’on remarque que l’on obtient (an — jbn)/2 à partir de (a, + jbn)/2 en changeant n en —n, 
on trouve des formules plus faciles d'emploi en posant : 
An — Jon an + Jon 


En = — ~~ et Con = —— avec Co = Qo. 
s 2 2 


Alors, la série trigonométrique écrit : 
oO 


f(x) = >> Cn EXP(iNwT), 


n= 


et les coefficients sont donnés par l'expression : 


T 
PR FO exp(—jnwz) dr 
0 


Il faut bien noter que ces dernières expressions n’apportent rien de plus que les précédentes du 
point de vue du calcul, mais elles servent d’introduction commode aux transformées de Fourier. 


11. Approximation des fonctions au sens de Tchebycheff 


Les problèmes d’approximation au sens de Tchebycheff ne sont pas à dissocier de l’étude des 
séries de Fourier. Soit une fonction f(x) continue à dérivées continues sur un intervalle (a, b). 
Nous recherchons une approximation g(x) de la fonction f(x) dans cet intervalle de telle sorte que 
sup |f (æ) — g(x}| soit le plus petit possible. C’est ce qui est convenu d'appeler l'approximation 
au sens de Tchebycheff. 

Examinons le cas où g(x) est un polynôme P,(x) de degré n. Pour l’amour de la simplicité et 
en faisant usage d’une transformation linéaire classique, ramenons l'intervalle (a, b) à l'intervalle 
canonique (—1, +1). Rappelons rapidement quelques résultats fondamentaux relatifs à linter- 
polation par des polynômes. Le polynôme qui passe par les (n + 1) points d’abscisse a; est le 
polynôme de Lagrange L,(x) de degré n. L'erreur commise E,(x) est donnée par l'expression : 


n+l (n+1) 
En(2) = fa) — Lal) = [[( - a) mo 


où ņ appartient à l’intervalle (—1, +1). 
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L'erreur sera rendue minimum en utilisant la propriété essentielle des polynômes de Tcheby- 
cheff, ce qui nous imposera le choix des abscisses, à savoir : 


2i+1 
ai = cos ( uan z) avec i = 0,1,2,3,...,n 


n+12 


Ces valeurs reportées dans lexpression du polynôme permettent d’obtenir une formule 
fournissant l'erreur minimum au sens de Tchebycheff. Pour des raisons pratiques, il est possible 
d'opérer de la façon suivante : toute puissance de x, notée x*, peut s'exprimer au moyen d’une 
combinaison linéaire de polynômes de Tchebycheff dont les degrés sont égaux et inférieurs à k. 
Donc, formellement : 


(z) = Ÿ pk Tk(x) 
k=0 


Il nous reste alors à calculer les coefficients pp. Pour cela, nous allons écrire l’erreur minimum 
E,(x) sous la forme d’un polynôme de Tchebycheff : 


Posons alors x = cos(Q). Eu égard à la définition des polynômes de Tchebycheff, on peut écrire : 


ficos(Q)] = S cos(kQ) + En cos(Q) = Y(Q), 


k=0 


en se souvenant que pour les valeurs a;, nous avons : 
n 
i) = X PkTr(ai) 
k=0 


et pour les valeurs 


2+17 
n+1 2’ 


Qi = 


nous avons : 


Y(Q:) = DZ cos(kQ;). 


k=0 


Les coefficients py sont donc les coefficients du développement en série de Fourier, tronqué à 
l’ordre n, de la fonction paire f|cos(Q)]. On peut écrire : 


Po = DIQ) m= Lre) cos(kQ;), 


ou encore : 


p=— Dia) m= DDC (kai). 
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12. Application des séries de Fourier au filtrage numérique 


D'un point de vue très simple, le filtrage numérique est une opération linéaire que l’on réalise 
dans l’espace réciproque de Fourier dans le but de modifier le spectre de fréquences ou de 
nombre d’ondes (filtre passe-bas, filtre passe-haut et filtre passe-bande pour faire référence 
aux applications radioélectriques). Ensuite on retourne à l’espace direct. Nous reviendrons 
plus en détail sur ces espaces, car pour ce qui concerne les séries de Fourier cette distinction, 
pourtant fondamentale, est peu perceptible dans la mesure où les fonctions sin{nwx) et cos(nwx) 
dépendent directement des arguments de l’espace direct et de l’espace réciproque, c’est-à-dire x 
et w. 

Pour fixer les idées nous allons étudier un filtre sans contrainte. On peut dire qu’un filtre 
linéaire est tout simplement un ensemble fini de coefficients Ap qui dépendent uniquement 
de l'opération que l’on souhaite réaliser mais certainement pas de la fonction f(t) à filtrer, 
coefficients qui viennent pondérer les valeurs des échantillons : 


N 
Dt) = XO Axf(t+kôt), (15.15) 
k=-M 


où ®(t) représente la fonction filtrée à l'instant t, ôt représente l'intervalle de temps entre deux 
échantillonnages, M et N sont deux entiers positifs. 

L'étude des filtres numériques linéaires peut passer par la notion de fonction de transfert. On 
étudie donc l’action du filtre sur un signal sinusoïdal que nous écrirons : 


F) = exp(jut). 


Par définition, la fonction de transfert en w du filtre (15.15) est donnée par l'expression : 


e(t) 
Tlw) = —— 
GIE pat 
on obtient donc : 
N 
T(w) = DD Ap exp(jkwôt). (15.16) 
k=_M 


Très souvent on se donne une fonction de transfert T(w), et il s’agit alors d'exprimer les 
coefficients A% correspondant à un filtre dont la fonction de transfert T_mn(w) soit la plus 
voisine de T(w) au sens des moindres carrés. Autrement dit, il convient de minimiser, dans 
l’espace réciproque de Fourier, l'intégrale calculée sur une période 27 /ôt : 

+7 /ôt 


j: Í Bun o do. 
—7/ ôt 


Il s'ensuit que les Az sont tels que : 
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et, en reportant la relation (15.16) dans la dernière intégrale, il est possible d'écrire : 


ar +7 /ôt N 
TA 2 f [a Ar exp(jkwôt) — T (w) | exp(jmwôt)dw. 
—7/ô4 = 


En faisant usage de la relation d’orthogonalité : 


+x/ôt 
2 
expljw(m + k)ôt]duw = SÂ mk: 
~n / őt 
on en déduit que : 
+T/ôt 

ôt : 
Ak = = T(w)}exp(—jkwôt)dw. 

T 

—7/ôt 


Deux remarques s'imposent : 


a. Les À, sont indépendants de M et N. 
b. Les Ax sont les coefficients de Fourier du développement de la fonction de transfert T (w). 


12.1. Application à l'étude d’un filtre passe-bas 


a — Nous allons porter notre attention sur un des filtres les plus simples à réaliser : la fonction 
«fenêtre » dans l’espace réciproque de Fourier. Ce filtre se définit de la façon suivante : 


0< lwl <w T{w) 
w < jw] < r/ôt T{w) = 


li 


1, 


Comme c’est manifestement un filtre symétrique, les termes en sinus sont nuls. Il reste à 
calculer les termes en cosinus : 
1 wıôt 
Ák = Pn cos(kuwidt) avec Áo = He 
T 


b — Il est préférable d'utiliser un filtre constitué d’une fonction continue afin de réduire les 
oscillations données par approximation. Aussi, pourra-t-on choisir un filtre du type suivant : 


0 < w| <w T(w)=1 
wi < w| < w2 Ti) = f1 oos (122) } 72 


Wa — WI 
wz < |w] < r/ôt T(w)=0. 


Tous calculs faits, on trouve les coefficients suivants : 
= T 
— 2k [r2 — k?ôt? (wa — wi )?] 


Un bon exercice consiste à représenter le filtre théorique ainsi que la fonction de transfert 
approchée pour N = M = 20 (cf. équation (15.15)), ensuite, d'appliquer ce filtre à une fonction 
présentant des irrégularités (courbe expérimentale entachée d'erreur). 


(w2 + w1)ôt | 


Ax 27 


[sin(kwzôt) + sin(kw10t)] avec Ao = 
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12.2. Remarques sur les opérations mathématiques réalisées lors du filtrage 


L'opération de filtrage que nous venons de réaliser traduit une convolution dans l’espace direct. 
Dans l’espace réciproque de Fourier nous avons réalisé le produit simple de deux fonctions qui 
sont la transformée de Fourier de la fonction f(t) à filtrer et de la fonction «fenêtre » T{w) 
qui est un filtre passe-bas. De retour dans l’espace direct, le produit simple de deux fonctions 
est transformé en produit de convolution. Nous reviendrons sur ces aspects des problèmes en 
abordant l'étude des transformées de Fourier. Cette dernière remarque prend tout son sens quand 
on passe à la programmation qui se réduit au calcul du produit de convolution de fonctions 
périodiques. Notons bien, ici, que la fonction de transfert est symétrique ce qui peut donner 
l'illusion de calculer une fonction de corrélation... 

On trouvera sur le Web (*) le programme filtre.c qui réalise le filtrage de données numé- 
riques entachées d'erreur. 


13. À propos du développement des fonctions non périodiques 


Il est parfaitement légitime de développer en série de Fourier (au sens large) une fonction f(x) 
non périodique dans la mesure où l'intervalle de définition (a,b) est fini et que la fonction 
satisfait aux conditions légitimes du développement. Il existe une restriction importante dans 
la mesure où l’on ne peut pas se servir du développement en dehors de l'intervalle de définition 
de la fonction. Par ailleurs, il est convenable de dire que le développement en série de Fourier 
constitue un prolongement analytique de la fonction f(x) en dehors de l'intervalle (a, b). 

En ce qui concerne les fonctions non périodiques définies sur un intervalle infini, elles font 
l’objet de traitements spéciaux appelés transformations de Fourier. 


14. Calcul des séries de Fourier à coefficients approchés dans L? 


Dans certains cas, le calcul d’une série au moyen de ses coefficients est un problème mal posé 
dont on trouvera l'étude dans l’ouvrage de Tikhonov cité en bibliographie. Voici un exemple 
concernant une série convergente : 


fit) = > an cos(nt). 


n=0 
Supposons que les coefficients a, soient entachés d’erreur et que l’on ait : 


E 
Cn = An + — avec Co = ao. 
n 


À la place de f1(t) on obtient la fonction 
o0 
ft) = 5 Cn cos(nt). 
n=0 
Dans la métrique de L?, les coefficients différent de : 
ae 1/2 a 1/2 
a=: Xenan)? sedy mer. 
n=0 4 v6 


donc €; est aussi petit que l’on veut. 


*http://wuw.edpsciences.com/guilpin/ 
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À présent, examinons la distance entre les fonctions fı(t) et f2(t). Elle est donnée par 
lexpression : 


cos(nt). 


Sir 


f(t) — fi) = DD 


Cette quantité peut être faite aussi grande que l’on veut : la série diverge pour t = 0. 
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16 | Les transformées de Fourier 


Depuis la vulgarisation des algorithmes rapides (1965), le rôle des transformées de Fourier dans 
les problèmes de traitement de fonctions échantillonnées s’est notablement accru. Ce n’est pas 
pour autant qu’il faille négliger l’apport considérable de la théorie qui a fourni notamment un 
catalogue de solutions formelles de problèmes. Cependant, le strict calcul numérique posé par 
un problème n'ayant pas de solution formelle connue était une entreprise à la fois très longue 
et très coûteuse. En calculant les intégrales au moyen de la technique des rectangles pour une 
fonction échantillonnées en 2048 points il fallait, avec une calculatrice de la fin des années 
60, environ 3 heures pour obtenir la transformée de Fourier. Le calcul des fonctions sinus et 
cosinus au moyen de relations de récurrence mentionnées par J. Arsac a ramené le même calcul 
à 3/4 d'heure tandis que l’utilisation de l’algorithme de Cooley-Tukey a permis d'effectuer la 
transformation en 45 secondes... Il ne faut pas oublier qu'ils ont eu des prédécesseurs méconnus 
qui ont œuvré tout à fait dans la même direction et il est probable que l’idée originale de cet 
algorithme soit due à Carl Runge (1856-1927) et à König. Sur ce sujet, on trouvera un petit 
aperçu historique dans l’ouvrage de E. Oran Brigham cité en bibliographie. 

Les transformées de Fourier trouvent leurs principales applications en optique, en cris- 
tallographie, en analyse harmonique, en traitement du signal, en résolution des équations 
de convolution, en corrélation (théorème de Wiener (1894-1952) - Kintchine), en théorie des 
probabilités (fonctions caractéristiques), et d’une façon générale, dans tous les problèmes où il 
y a avantage à travailler dans l’espace réciproque. 


1. Extension des séries de Fourier au cas où la période est infinie 
L'idée consiste à isoler une partie de la fonction f(t) sur un intervalle fini (—T/2, +T/2), puis 


à procéder à son développement en série de Fourier, et enfin à faire tendre T vers linfini et à 
examiner le résultat. En posant : 


Q = 27/T, 


on obtient le développement : 


ft) = ns $ > lan cos(nQt) + bn sin(nQt)] (16.1) 


n=l 
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+T/2 


2 
avec an = y i f(x) cos(nQzx) dx 
-T/2 
+T/2 


n= Z T f(x) sin(nQx) dz 


-7/2 


À présent, posons w = nQ, cela nous permet d’obtenir une autre forme du développement : 


f(t) = to DE Q [an cos(wt) + bn sin(wt)]. (16.2) 


Dans cette nouvelle représentation, on peut dire que Q est l'accroissement de w pris entre deux 
valeurs consécutives. Autrement dit, on peut considérer que Q est accroissement 6w de w. Le 
développement (16.2) s’écrit alors : 


+T/2 +T/2 
FE) = Ij” f(x) dz + — > ðw f f(x) [cos(wx) cos(wt) + sin(wx) cos(wt)] dx. (16.3) 
re -T/2 
Soit encore : 
+T/2 +T/2 
=7 | fat Da | 10 cos[w(x — t)] dz. 
E -T/2 


Si, pour T tendant vers l'infini, l’on fait Phypothèse que : 


1 > f 
lim T | f(x) dx =0, que ôw — dw et que >» — f 
-T/2 w= o 


alors on peut écrire : 


. il dw Tro cosfw(r — t)] dz. (16.4) 


C’est le développement en intégrale de Fourier de la fonction f(t). On peut encore écrire : 


O0 


+00 +00 
f(E) = | cos(wt) f f(x) cos(wx) dz + sin(wt) f f{æ)sin(wx) dr ọ dw. 


0 


Ces formes de développement correspondent aux développements en série de Fourier de 
fonctions offrant «un spectre continu » encore appelé «spectre de bandes ». 
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1.1. Intégrale de Fourier en termes complexes 


Partons du développement en série de Fourier en termes complexes : 


+00 
FO = F cn exp(in#), 
+T/2 
1 
avec Cn = 7 f f(x) expl- jnQzr) dz. 
=T]? 


En conservant les mêmes conventions que précédemment : 


nA=w et ðw —> dw=Q, 


on écrit : 
145 
FE) = È D en expljot), 
d’où 
die if +T/2 
0-7 D |7 | 10e jwa) de | expljwt, 
TS -T/2 
pie +T/2 
soit encore f(t) = 9x w f f(x) exp(—jwr) dz | exp(jwt). 
di —T/2 


En effectuant une extension à l'infini, nous obtenons : 


+00 +00 
O= f $ J OE old (16.5) 


On peut encore poser : 


+00 
f= faw exp(jwt) dw 


+00 
Glu) = = f EE 


Il s'agit dans cette dernière forme d’une des expressions les plus employées appelées l’une 
transformée de Fourier directe, l’autre transformée de Fourier réciproque. Bien des tables de 
transformées de Fourier utilisent cette notation, cependant, on préfère utiliser des formes plus 
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symétriques en adoptant les expressions suivantes : 


+00 
ft) = f G(x) exp(2rjwt) dw 


+00 
G{w) = f f(t)exp(—2rjwt) dt (16.6) 


Les équations (16.6) sont des équations fonctionnelles. 


1.2. Relation entre différentes définitions 


Les tables d’intégrales de Fourier utilisent généralement une notation plus concise qui ne fait 
pas usage du facteur 27 : 


vfo) = | rexpt-jot dt, 


que l’on peut écrire encore : 


Y(w) = Jro exp (-2rivx.) d=G (ż) | 


Remarque : Rien n'empêche de choisir des signes opposés dans les exponentielles pour définir 
les transformées directes et réciproques, soit : 


+00 
f= Î G(x) exp(—2rjwt) dw 
+00 


G(w) = f FO Brut) dt. 


Il est évident qu’il faut se tenir à un choix pour effectuer les calculs. 


2. Conditions d'existence des transformées de Fourier 
dans les espaces L! et L? 


2.1. Définition 


L'espace L! est l’espace fonctionnel des fonctions intégrables en module, tandis que l’espace L? 
est l’espace fonctionnel des fonctions de carré sommable. 
+020 
Si f(x) appartient à L! alors intégrale { |f(z)| dx existe. 


— o0 
+20 


+00 
Si f(x) appartient à L? alors l'intégrale f f?(x) dr (ou J f(x) f(x) dx) existe. 
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Dans ce paragraphe, nous désirons rappeler les résultats théoriques essentiels. Il faut bien 
reconnaître que l'usage pratique des transformées de Fourier passe exceptionnellement par les 
considérations qui vont suivre, le physicien rencontrant en général «de bonnes fonctions ». Quoi 
qu’il en soit, un survol rapide de la théorie doit permettre d'éviter quelques pièges que l’on peut 
rencontrer dans la théorie des fonctions échantillonnées. Le problème fondamental repose sur les 
conditions d'existence de l'intégrale de Fourier qui est l’une des expressions (16.6). 

Disons tout de suite que la notion d’intégrale de Riemann ne suffit plus pour l’étude de 
tels problèmes, et que l’on doit lui substituer la notion d’intégrale au sens de Lebesgue (1875- 
1941). Voici pourquoi : le point essentiel repose sur le fait que la limite d’une suite de fonctions 
intégrables n’est pas nécessairement une fonction intégrable ni au sens de la convergence simple 
ni au sens de la convergence uniforme. Le lecteur intéressé trouvera des développements et des 
exemples dans les ouvrages cités en bibliographie; en particulier, des exemples de fonctions 
bornées qui ne sont pas intégrables au sens de Riemann. 


2.2. Conclusions 


a. L'espace L! des fonctions sommables au sens de Riemann n’est pas complet puisque la limite 
d’une suite de fonctions intégrables au sens de L! n’est pas nécessairement une fonction 
intégrable. 

b. Il existe des fonctions parfaitement définies qui ne sont pas intégrables au sens de Riemann. 
C'est le cas de fonction discontinues ne comportant que des discontinuités de première espèce. 


Les mathématiciens ont trouvé une définition plus générale de l'intégrale de Riemann afin 
que L! soit toujours un espace vectoriel, complet au sens de la norme Li. Au fond, il s’agit 
d’un élargissement de la classe des fonctions intégrables. C’est à Henri Lebesgue (1875-1941) 
que revient le mérite d’avoir découvert la nouvelle intégrale en 1902. Non seulement l’espace 
L! devient un espace complet mais aussi L?, ce qui lui confère un intérêt de tout premier plan 
lors de l'étude des séries de Fourier et des développements en séries de fonctions orthogonales. 
Nous ne parlerons pas davantage de cette intégrale qui passe par la notion d'intégration de 
mesures abstraites. Insistons toutefois sur un point essentiel : lorsque l'intégrale de Riemann est 
réellement calculable, elle donne le même résultat que l'intégrale de Lebesgue. 


3. La transformée de Fourier dans l’espace L! 


On dit que f(x) appartient à l’espace L! si, pour la fonction f(x) à valeurs réelles ou complexes, 
on à : 


+00 
JFG à (o Sni). (16.7) 


Ici, la norme est celle de la convergence en moyenne. 


3.1. Théorème 


La transformée de Fourier 


+00 
F(t) = J f(z)exp(2rjxt) dx 
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existe si f(x) appartient à L!. 
En effet, on a les inégalités suivantes : 


+00 +00 
J Fo epCrie0 a < I |f(£)| dz = fo- 


Donc F(t) existe pour tout t, de plus F(t) est bornée uniformément : 
IF(&)| < [f(æ)]. 


3.2. Propriétés essentielles dans L! 


Rappelons que l’on note : 


1. La T.F. est linéaire. 
2. La translation qui consiste à changer x en (x — y) donne : 


EF: 


f(z-y) ~> F(t)exp(2rjty). (16.8) 
3. La symétrie donne : 
f(z)exp(—2rjzzx) TR F(t- 2). (16.9) 
4. La dilatation d’abscisse, si a Æ 0, donne : 
pa me). (16.10) 


Il faut bien noter que le cas particulier a — 0 ne présente pas beaucoup d'intérêt. En effet, 
si a = 0, f(0) est une constante et la fonction constante n'appartient pas à Lt. 
5. Si f(x) appartient à L! et si la fonction x f(x) appartient aussi à L!, alors F(t) admet partout 
une dérivée F’(t) bornée qui est la transformée de Fourier de 2rjxf{x) : 


2njaf(a) 25 Ft). 


Si f(x) est dérivable n fois, et si f(x) ainsi que ses n premières dérivées appartiennent à 
L}, alors : 


f(x) > (-2rit)PF(6) 


ou encore 


TF 1 
(2rjt)? 


z f(x) FP). 


6. Continuité de la transformée. Si f(x) appartient à L' sa transformée de Fourier F(t) est 
uniformément continue pour toute valeur de t. 
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7. La réciprocité de la transformée de Fourier pose un problème délicat. En effet, l'intégrale 
(16.7) est prise au sens de Lebesgue, et sa valeur n’est pas modifiée quand on change les 
valeurs de f sur un ensemble de mesure nulle. 

8. Si f et F appartiennent ensemble à L1, alors nous avons légalité de Parseval (1755-1836) : 


+00 +00 
PACE = Î IFP dt. (16.11) 


Il faut alors des propriétés de continuité pour déterminer f(x) en tout point à partir de 
F(t). Du point de vue du physicien, l'égalité de Parseval ne fait que traduire le principe de 
conservation de l'énergie. 


3.3. Exemples de fonctions transformées de Fourier l’une dans l’autre 


f@) £5 FA 


1 


exp(—Tx?) = exp(—rt?) 
TF 
a(l +4) 


exp(—2r|x|) 


= 1 si x appartient à (—1/2,+1/2) 


f(x) TE sin(rt) 
nt 


= 0 ailleurs 


= 1 si x appartient à (a,b) 


f(z) £5 are all exp|irt(b — a)] 
= 0 ailleurs 


Dans ces deux derniers cas, F(t) n'appartient pas à L!, cependant la transformée de Fourier 
inverse existe si l’on prend la valeur principale au sens de Cauchy. 


=]-— |z| si z appartient à (—1, +1) 


fa) ZE, (>00) 


mt 
= 0 ailleurs . 


4. Les transformées de Fourier dans l'espace L? 


On dit que f(x) à valeurs réelles ou complexes appartient à L? si l’on a : 


+00 
J Fe as = ire, (16.12) 
— 00 
c’est-à-dire que l'intégrale existe. 
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Propriétés fondamentales 


Si f(x) appartient à L?, on peut démontrer que F(t) appartient aussi à L? et que nous conservons 
légalité de Parseval : 


+00 +00 
J Peris Î F?(t) dt. 


Ces démonstrations reposent sur les propriétés des suites de Cauchy. Les autres propriétés 
rencontrées dans l’espace L! restent vraies dans l’espace L? à savoir : la linéarité, la translation, 
la dilatation d’abscisse. 


5. Produit de convolution dans les espaces L! ou L? 


C’est un problème qui joue un rôle important en physique et en traitement du signal. Notam- 
ment, toutes les mesures expérimentales sont les résultats du produit de convolution du signal 
fondamental et de la fonction d'appareil. Par exemple, en spectroscopie, l'observation d’une raie 
est le produit de convolution du profil donné par la source lumineuse et de la fonction d’appareil 
qui a permis l’observation. Si l’on utilise un spectromètre à fentes, en première approximation, 
la fonction d'appareil est constituée de la «fonction fente » (triangle isocèle). 


5.1. Définition 
On appelle produit de convolution de deux fonctions f(x) et g(x) une fonction h(x) définie par 
l'intégrale : 
+00 
(a) = f Fogle- 0 du (16.13 
— C0 

qui est notée d’une façon plus concise : h = f x g. 
Remarque : Le produit de convolution est commutatif, c’est-à-dire que h = f xg = g» f. Il faut 


respecter certaines conditions pour que cette intégrale existe. L'existence est assurée notamment 
quand f et g appartiennent à L! ou L?. 


Supposons que les fonctions f(x) et G(t) appartiennent à L!, de telle sorte que : 
+00 
F(t) = Í f(x) exp(j2rxt) dx 
et 


g(x) = J G{t) exp(—j2rxt) dt. 
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Alors, g(x) est bornée et l’intégrale définissant le produit de convolution existe. Remplaçons 
g(x) par sa transformée de Fourier dans l'intégrale (16.13) : 


+00 +00 +00 
na = | How ae f so À f Celje- y) dt | av: 
En inversant l’ordre des intégrations, on obtient : 
+00 +00 
ha)= | Gexp(-25rt) | f fu expasrtu) dy | at 
—00 —00 


et par suite : 


+00 


h(x) = J G(t)F(t) exp(—-2jrtx) dt, 


CO 


h(x) étant une fonction bornée et la fonction [G(t) : F(t)] appartenant à L!, il s'ensuit que h(x) 
est la transformée de Fourier de G(t) - F(t). 

La démonstration est encore plus simple si f(x) et G(t) appartiennent à L? ; en effet, on sait 
que les transformées de Fourier g(x) et F(t) appartiennent à L?. Il s'ensuit que la transformée de 
Fourier transforme un produit de convolution en un produit simple de transformées de Fourier. 
On résumera les opérations ainsi : 


fa) 35 F 
ga) + ai) 
f*g IR paG 
f-g Tie PG 


5.2. Remarque sur le sens de la transformée de Fourier 


Du point de vue de la physique, la connaissance de la fonction f(x) est strictement équivalente 
à la connaissance de la fonction F(t) ; Pune et l’autre fonctions contiennent exactement la même 
information. Par ailleurs, légalité de Parseval n’est rien d’autre que l'expression du principe de 
conservation de l'énergie. 


5.3. Sur la symétrie et la parité des fonctions 


Si la fonction f(x) possède certaines propriétés de symétrie il en va de même de sa transformée 
de Fourier F(t). Le tableau 16.1, page suivante donne les principales correspondances. 


5.4. Transformées de Fourier et produit scalaire 


Le produit scalaire de deux fonctions f(x) et g(x) est défini par l'intégrale du produit des deux 
fonctions : 


+00 +00 
(f(x), g(x)) = | f(æ)g(x) de (= I f(x)g* (x) dz si les fonctions sont complexes). 
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Tableau 16.1. 


F(t) 


réelle paire 


fa) 

réelle paire 
réelle impaire imaginaire impaire 
imaginaire paire imaginaire paire 
imaginaire impaire réelle impaire 
complexe paire complexe paire 
complexe impaire complexe impaire 
partie réelle paire; 


partie imaginaire impaire 


réelle quelconque 


e SEREEERE 


imaginaire quelconque partie imaginaire paire ; 
partie réelle impaire 
partie réelle paire; 

partie imaginaire impaire réelle quelconque 


partie réelle impaire ; 


R B 


partie imaginaire paire imaginaire quelconque 


Si f(x) et g(x) appartiennent à L?, ces fonctions admettent chacune une transformée de 
Fourier désignée respectivement par F(u) et G(u). Comme nous avons l'égalité de Parseval : 


+00 +00 
Í fe) f (2) de = 1 F(t)F* (t) dt, 


nous allons en déduire quelques propriétés sur le produit scalaire des fonctions appartenant à 
Ľ?. La linéarité de l’opération d'intégration nous permet décrire : 


+00 +00 


f [f(æ) + g) [f* (=) + g* (x)| dz = f [F (t) + G(t)| [F* Œ) + G*(t)] dt, 
et 
+00 +00 
J (fx) + 59) [f* (2) — jg* (x)] dx = Í [F (t) + IGE) [FE — IG* 6) dt. 


La combinaison de ces deux relations jointe à légalité de Parseval nous donne : 


+% 


+00 
f J(e)" (2) de = | F(ÐG* (+) dt. 


— 0 
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L'exploitation de cette dernière égalité en liaison avec la convolution donne également une 
expression intéressante concernant une forme de produit scalaire : 


(f(x — u),g n= feu (x) dz = Jro t)G* (t) exp(2rjtu) dt, 
d’après le théorème de translation sur l’axe des abscisses. Par ailleurs, nous avons les relations : 
+00 
I rejea A 
+00 
1 f(—z +u)exp(2rjtx) dx = F(-t)exp(2rjtu), 
il s'ensuit : 
(f(-x + u), p= J re ou f ree (t)exp(2rjtu) dt. 
En rappelant que : 
+20 +00 a 
Î g*(x)exp(2rjtx) dx = J g(x) exp(—-2rjtx) dx| = G*(—t), 
—o0 — 00 


et en remplaçant g*(x) par g(x) on change G*(t) en G(—t), on peut écrire : 


+00 Fog 
(f(e + u), g(2)) = ; f(e- u)g(e) de = I F(—t)G(—t) exp(2rjtu) dt. 


Maintenant, remplaçons t par —t dans la dernière égalité, nous obtenons : 
(flu -— z), g p= J re-u g(x) dz = Jro G(t)exp(—2rjtu) dt 
soit encore : 


+00 
{flu —x),g(x)) = Í F(t)G(t) exp(-2rjtu) dt. 


Si l’on fait u = 0, on obtient l’expression : 


(x), g(x)) = (F), G). 
Comme f(x), g(x) d’une part, F(t), G(t) d'autre part jouent des rôles symétriques, compte 
tenu de la réciprocité des transformations de Fourier, on a les autres relations : 
(F(æ),g(—x)) = (F8), G(E)), 
(F(z), g(2)) = (F(-t), G()), 
(F(æ),g(x)) = (F(E), G(~¢)). 
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Certaines de ces relations sont utilisées dans les paragraphes évoquant l’approximation de 
fonctions de L? au moyen des fonctions du cylindre parabolique, fonctions rattachées aux 
polynômes d’Hermite (cf. Chapitre 10). 


6. Sur le calcul numérique des transformées de Fourier 


Il existe quelques fonctions dont on connaît la transformée de Fourier, lesquelles ont été 
réunies dans des tables. Malheureusement, les équations fonctionnelles (16.6) n’admettent pas 
toujours des expressions littérales de transcendances élémentaires. Un autre problème se pose 
lorsque l’on a affaire à des données expérimentales composées d'échantillons — le plus souvent 
distribués selon une progression arithmétique. En apparence il suffit de calculer numériquement 
les intégrales (16.6), mais l'expérience montre que les temps de calcul sont prohibitifs et qu'il faut 
trouver des algorithmes extrêmement élaborés pour parvenir à des temps de calcul raisonnables. 
Nous allons donc examiner le problème sous cet aspect en accordant notre attention aux fonctions 
échantillonnées. 


7. Cas des fonctions échantillonnées 


Puisqu’il s’agit essentiellement d’un point de vue pratique, il faut préciser que les fonctions f(x) 
ne peuvent être connues que sur un intervalle fini (—a/2,+a/2). Ceci est dû aux impératifs 
de nature physique et humaine : le temps d'observation est limité et la densité d’information 
recueillie pouvant être manipulée est finie. Par ailleurs, on supposera que la fonction f(x) est 
donnée par un ensemble d'échantillons qui sont pris en progression arithmétique, soit (2n+1) leur 
nombre et l’on notera (£k, Yk) les couples de points représentant la fonction. D’ores et déjà, on 
est en mesure de dire qu’il n’y aura aucune différence entre une transformée de Fourier calculée 
numériquement et la série de Fourier. En effet nous avons procédé à l’extension de l'intervalle 
de définition des fonctions périodiques pour parvenir à l’étude des transformées de Fourier, mais 
maintenant nous ne sommes en mesure que de traiter numériquement les fonctions définies sur 
un intervalle fini... Il va de soi que les algorithmes que nous allons décrire permettront de calculer 
les coefficients des développements en série de Fourier. Avant d’entreprendre à proprement 
parler l'étude des algorithmes fondamentaux, il nous faut rappeler les propriétés essentielles 
des fonctions échantillonnées et de leur transformée de Fourier. 


a. Le pas d’échantillonnage est h = a/(2n) et la période de la fonction f(x) est a, alors, dans 
l’espace réciproque, la période de la transformée de Fourier F(t) est T = [-—1/(2h),+1/(2h)] 
et son pas d’échantillonnage est r = 1/a. 

b. Le calcul des échantillons de la transformée de Fourier F(t) se fait selon une progression 
arithmétique de raison r. On calcule donc 2n points dans l’espace réciproque. 


On démontre qu'aucune information n’est perdue en opérant de cette sorte. 2n points en 
progression arithmétique sont nécessaires et suffisants. Le fait de prendre davantage de points 
n’apportera rien en précision et cela ne fera qu’accroître le temps de calcul. En revanche, il 
existe un problème beaucoup plus délicat qui est celui de déterminer convenablement la période 
d’échantillonnage A. Nous reviendrons en détail sur ces problèmes. 
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8. Calcul par un algorithme ordinaire 


Il s’agit ici de calculer les intégrales (16.6) au moyen de la méthode des rectangles ; la raison en 
est la suivante : comme les fonctions sont périodiques, il est indispensable d’affecter à chaque 
point d’échantillonnage le même poids pour obtenir le même résultat quel que soit le point choisi 
pour définir le début d’une période. On approche F(t) au moyen de l'expression suivante : 


n—1 


F(t)=h X. J(kh)exp(2rjkht). (16.14) 


k=-n 


Dans le cas où f(x) est une fonction réelle, nous pouvons écrire : 


n—1 n—1 
F(t)=h X f(kh)cos(2rkht) + jh X` f(kh)sin(2rkht). 
k=-n k=-n 


Il est plus commode de poser : 


ra = f(ah) + f(-qh) 

8a = f(gh)— f(—-qh) avec g—0,1,2,...,n—1 
et rn = f(—nh) 

Sn = —f(-nh). 


Cette façon de procéder revient à décomposer une fonction en une somme de deux fonctions, 
l’une paire et l’autre impaire; en posant F(t) = Fr(t) + jFy(t), cela nous permet d’écrire : 


n 
Frit) =h Yri cos(2rkht) 
k=0 


Fy(t) = hŸ sksin(2rkht). (16.15) 
k=1 


Remarque : Nous avons déjà dit que les relations (16.15) étaient simples à calculer mais qu’elles 
exigeaient un temps de calcul considérable. Cependant, il y a moyen de diviser le temps de calcul 
par trois environ en effectuant la remarque suivante : L'argument de base des sinus et cosinus est : 
Oo = 2rht, ce qui fait que les arguments des sinus et cosinus sont en progression arithmétique 
de raison Oo. Comme l’appel des fonctions de bibliothèque SIN et COS demande un temps 
important, il est beaucoup plus astucieux de calculer ces fonctions au moyen des relations de 
récurrence du type : 


cos[(p + 1)90] = 2 cos(@o) cos(p@o) — cos[(p — 1)O0)] 
sin[(p + 1)@0o] = 2 cos(@o) sin(p@) — sin[(p — 1)60]. (16.16) 


Les relations (16.16) ne sont pas uniques, et l’on peut trouver des relations de récurrence tout 
à fait analogues. Quoi qu’il en soit, il suffit de calculer au départ seulement Ao = cos(@) et 
Bo = sin(@o) puis d'utiliser les formules de récurrence : 


Ap+1 = 2404» = Ap-1 
Bp+1 Ek 245B, = Bp-1- 


261 


MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ 


Quelles que soient les formules de récurrence utilisées, elles mettent en œuvre toujours une 
soustraction, et l’on va observer une lente dégradation de la précision des valeurs calculées pour 
les sinus et cosinus. C’est pourquoi il est utile de les calibrer de temps en temps, c’est-à-dire 
d'utiliser les fonctions de bibliothèque tous les 1024 points par exemple et de calculer les points 
intermédiaires au moyen des relations de récurrence. 

La transformée de Fourier réciproque ne présente pas plus de difficulté à calculer, on écrira 
simplement : 


n—1 


f(x) =r X F(Ih)exp(—2rjlht). (16.17) 


l=-n 


D’une façon générale, dans les relations (16.15) et (16.17), les fonctions f(x) et F(t) sont des 
fonctions complexes de variables réelles respectivement x et t. 


9. L'algorithme de Cooley-Tukey (1915- ) 


Il s’agit d’un algorithme que l’on désigne souvent sous le nom de FFT (fast Fourier transform). 


9.1. La transformée de Fourier discrète 


Il suffit de reprendre les formules (16.15) et (16.17) en précisant que les points qui doivent être 
calculés sont ceux qui sont en progression arithmétique de raison r ou de raison h selon l’espace 
que l’on considère. Donc, si l’on fait x = mr, on obtient : 


n—1l 


F(mr) = D f(kh) exp(2rjkhmr) ; 


k=-n 


mais comme r = 1/(2nh) il est plus commode d'écrire : 


n—l1 
mk 
F(mr) = RD TON exp (27; z) . (16.18) 
Réciproquement, on a la transformée inverse : 
n—1l kq 
kh) = F(qh —2rj— |: 16. 
f(kh) pa (q )exp ( riža) (16.19) 
Par ailleurs, si la fonction f(x) est périodique de période a, on aura les égalités suivantes : 
n—l+p1 mk 
F = — ; 
(mr)=h 5y f(kh) exp (27 me) (16.20) 
k=-n+p] 
n—1+p2 kq 
kh) =r F(qh) exp | —2rj— |: 16.21 
f(kh) ne (ah) »( ja) (16.21) 


quels que soient les entiers pı et pp. On s'aperçoit que le calcul des transformées de Fourier 
fait appel à des valeurs numériques qui sont strictement liées à la nature de l’échantillonnage. 
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Comme cela est sans intérêt, on préfère travailler sur une transformée de Fourier normalisée, 
c’est-à-dire que l’on va effectuer une transformation linéaire des abscisses de telle sorte que 
l'intervalle arbitraire (—a/2,+a/2) soit transformé en un intervalle de longueur unité, soit 
Pintervalle (—1/2,+1/2). Il faudra se souvenir de cette opération lorsque l’on désirera effectuer 
une interpolation dans les transformées de Fourier. 


9.2. Normalisation de la transformée de Fourier 


Pour obtenir la normalisation, il suffit donc de poser : 
a=2nh=1, N=2n, et p=p = 0. 
Il s'ensuit que : 
h=1/N, r=1, T=N=i/h. 


Rappelons que T est la période de la transformée F(t). Puisqu’on ne calcule qu’un nombre 
fini de points de la transformée, il est plus commode d’écrire en indice le numéro du point 
c’est-à-dire que l’on notera désormais : F(mr) = Fm et f(kh) = fk 

Comme dans le cas du calcul des fonctions trigonométriques, nous poserons : Wy = 
exp(2rj/N). Par ce procédé, les transformées de Fourier discrètes normalisées s’écrivent sim- 
plement : 


1 N-—1 : 
Fk = N tiwi 
j=0 
1 N—1 
h= FEW (16.22) 
k=0 


Il faut bien reconnaître que, jusqu’à présent, nous n’avons pas amélioré la technique de calcul, 
et nous avons toujours besoin de N opérations complexes pour mener à bien les calculs. 

Maintenant, nous allons étudier un algorithme qui rend le temps de calcul non plus propor- 
tionnel à N? mais à N log, (N). Pour des raisons qui deviendront évidentes par la suite, on 
choisira un nombre N de données qui est une puissance de deux, et l’on posera N = 2”. 


9.3. Calcul de la transformée de Fourier au moyen de la technique de partage 


Théorème — La transformée de Fourier d’une fonction quelconque connue en N points est une 
combinaison linéaire d’une transformée de Fourier de deux fonctions issues de la première et ne 
comportant que N/2 points chacune. 

Pour démontrer cette proposition, nous allons décomposer la fonction f(x) en deux fonctions, 
l’une constituée des indices impairs f21+1 et l’autre des indices pairs fz. Il est bien entendu que 
l’on conserve l’ordre des échantillons dans la fonction f(x). 

On désigne par u la fonction constituée par les échantillons d’indice pair et par v la fonction 
constituée par les échantillons d’indice impair, chacune de ces fonctions comprenant N/2 points. 
Les transformées de Fourier respectives de u et v sont désignées par U et V ; on obtient leurs 
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expressions en utilisant les relations (16.22) : 


2 ik 2 2jk 
Uk = N 5 ujWij = N « 5WYN 
j=0 j=0 
N/2-1 
2jk 
et = > ywa 


Si à présent nous revenons à l'expression de F dans laquelle nous séparons les parties 
constituées par les indices pairs et les indices impairs, nous pouvons écrire : 


N/2-1 N/2—1 | 
Nez X ywa Y WE Tr, 
j=0 j=0 


Il n’y a plus qu’à substituer les expressions de U et V, ce qui donne : 
2Fy = Ur + VWE. (16.23) 


Cette expression ne permet de calculer que la moitié de la transformée de Fourier, et il faut 
une autre relation pour obtenir lautre moitié. Pour cela, il suffit de remarquer que les fonctions 
U et V sont périodiques de période N/2, par conséquent nous pouvons dire que : 


Ur = Uk+nj2 et Vk = Vérins. 


Comme par ailleurs nous avons : 
k 
WEtN/2 -WE = exp (25%) 


nous obtenons la relation (16.24) : 
2Fp4nye = Ur — VWA. (16.24) 


À présent on comprend l'intérêt d’avoir choisi pour N une puissance de deux, puisqu'il va de 
soi que l’on va calculer chacune des transformées U et V par le même procédé. 


9.4. Mise en œuvre de l'algorithme 


Il y a plusieurs réalisations pratiques possibles pour utiliser cet algorithme. 


a. Si l’on dispose d’un langage récursif, c’est le cas du Pascal, du C, du PL1... — et dans la 
mesure où le temps de calcul n’est pas prohibitif — il wy aura pas de difficultés particulières 
pour réaliser un programme car le tri des données initiales se fera par appel récursif. 

b. Si l’on ne dispose pas d’un langage récursif — c'était le cas du FORTRAN et du BASIC — 
il est indispensable de procéder à un tri préalable des données initiales afin de commencer 
les calculs de transformées par les fonctions contenant deux éléments, puis en poursuivant 
par les fonctions à quatre éléments, puis à huit, seize... Donc le problème qui se pose est 
celui de la disposition convenable des échantillons au départ, lesquels ont été pris dans l’ordre 
séquentiel. Autrement dit, il s’agit de savoir à quelle place (indice) il convient de mettre la 
donnée d'indice k. Il y a deux méthodes usuelles qui permettent de réaliser élégamment cette 
tâche à savoir le tri direct et le tri par inversion de bit. 
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a — Le tri direct — Dans l’ordre séquentiel on considère la donnée d’indice k, cette donnée sera 
placée à l’indice j ; nous allons donner la correspondance entre k et j en faisant l'hypothèse que 
le premier indice est zéro et le dernier N — 1. Désignons par q l’'exposant de deux qui permet 
d’encadrer le nombre k de telle sorte que : 


21 < k < Dire 


alors nous obtiendrons la valeur de j au moyen de la relation de récurrence suivante : 
j = Ry(k) = Ry(k — 21) + — 
et l’on prendra au départ : Ry (0) = 0. 
Cette méthode s'applique pour k = 0,1,2,3,...,N — 1. La manière de l’exploiter sur un 


ensemble de huit données numérotées de un à huit est présentée dans le tableau 16.2. 


Tableau 16.2. 


Indices initiaux Indices finals 
0 q=0 Rs(0)=0 0 
1 q=0 Ra(1) = Rg(0) Ea 8/2 4 
2 q= 1 Rs(2) = Rg(0) T 8/4 2 
4 q=2 Rg(4) = Re(0) + 8/8 1 
5 q=2 Rs(5) = Rg(1) + 8/8 5 
6 q=2 R3(6) = Re(2) + 8/8 3 
T q=2 Rs(7) = Rg(3) T 8/8 7 


b — Tri par inversion de bit — Pour des raisons de simplicité, on considère encore que les 
indices commencent à la valeur zéro et se terminent donc à la valeur N — 1. Il faut donc 
m = log,(N) bits pour exprimer tous les indices de la fonction échantillonnée dans le système 
binaire. Pour obtenir l'indice j, il suffit d’intervertir l’ordre des chiffres binaires représentant le 
nombre k avec m bits et l’on obtient ainsi la représentation binaire du nombre j. 


9.5. Exemple 


Nous avons huit données numérotées de zéro à sept et nous obtenons une représentation binaire 
sur trois bits. La façon d’opérer est schématisée sur le tableau 16.3, page suivante. 


9.6. Remarques générales 


1. Certaines données conservent le même indice. 

2. Il est simple de passer d’une numérotation à l’autre selon que la première donnée à la valeur 
zéro ou la valeur un, et il suffira de retrancher ou d’ajouter une unité pour exploiter à notre 
convenance l’un des deux algorithmes que nous venons de présenter. 
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Tableau 16.3. 


Indices initiaux Indices finals 
Décimal Binaire Binaire Décimal 
0 000 000 0 
1 001 100 4 
2 010 010 2 
3 011 110 6 
4 100 001 1 
5 101 101 5 
6 110 01l 3 
T 111 111 7 


10. Programmes de calcul des transformées de Fourier 


On trouvera sur le Web®) les sous-programmes dfftO.h et dfftinvO.h pour calculer les 
transformées de Fourier. Nous avons retenu une méthode non récursive agrémentée d’un 
algorithme de tri direct des données. Ces programmes nécessitent quelques commentaires. 


1. Lors du calcul de la transformée directe, le calcul successif des transformée au moyen des 
relations (16.23) et (16.24) impose la division des résultats par N. Cette opération a été 
réalisée au cours du tri et non pas après les calculs (les opérations sont linéaires). 

2. Comme le montrent les relations (16.22), il ne faut pas diviser les données par N lorsque l’on 
calcule la transformation réciproque. 

3. Il est très facile de se retrouver en présence d’un fâcheux décalage de m lors du calcul 
des transformées de Fourier. Généralement ceci est dû au fait que les données ont été mal 
numérotées au départ : il faut que le premier échantillon se trouve à l’origine. La plupart 
des programmes exigent cette façon de procéder. Nous ne l’avons pas retenue pour la raison 
suivante : lorsque l’on traite des données échantillonnées au cours du temps, la première 
donnée qui se présente correspond à l’abscisse normalisée —1/2 et non pas zéro. Dans ce cas 
il ne semble pas habile d’attendre d’être en possession de toutes les données pour effectuer 
le décalage d’abscisse avant d’entreprendre le calcul effectif de la transformée de Fourier. 
C’est pour cela que la transformée de Fourier directe que nous proposons tient compte de ce 
décalage. Par conséquent, si l’on utilise ce programme avec des données numérotées à partir 
de l’origine, on se trouvera également en présence d’un déphasage de 7. Il convient alors de 
noter que le module de la transformée de Fourier est correct. 

4. Quelle que soit la manière retenue, les résultats de la transformée de Fourier directe sont 
donnés à partir de l’origine. Autrement dit, dans l’espace réciproque, le premier point calculé 
est celui correspondant à l’origine, et l’on aura les points suivants jusqu'à la demi-période 
1/(2h) ensuite viendront les points de la demi-période —1/(2h) jusqu’à zéro non compris. 

5. C’est pour les raisons expliqués au cours du paragraphe précédent que la transformée de 
Fourier réciproque effectue les calculs à partir de l’échantillon correspondant à l’origine. 


* http://www.edpsciences.com/guilpin/ 
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Espace direct Espace réciproque 
Fr + 
-a/2 © +a/2 — Tf2 o + T/2 
Figure 16.1. Avec 
h=a/N r= 1/a, 
h=1/T T=1/h, 
a=1/r N=T/r. 


6. Lors de la mise au point d’un programme de transformées de Fourier, il est raisonnable de 
réaliser simultanément la transformée directe et la transformée réciproque qui n’admettent 
que peu de différences. Ainsi, après avoir obtenu la transformée directe, on revient dans 
l’espace initial au moyen de la transformée réciproque... et l’on doit retrouver les données 
initiales (à partir de l'échantillon correspondant à l’origine). Cela constitue un bon test de 
mise au point. Par ailleurs, ce procédé permet d'apprécier de façon tangible les erreurs qui 
viennent altérer les résultats, car on observera de toute façon des divergences par rapport aux 
données initiales, divergences qu’il est souhaitable de trouver de quelques ordres de grandeur 
de l'erreur de troncature affectant les nombres traités en machine. Cependant, il convient de 
se souvenir que le calcul rapide des fonctions trigonométriques intervenant dans les calculs 
sont des sources d'incertitude qu’il ne faut pas négliger. 


11. Un problème fondamental : quelle doit être la période 
d’échantillonnage de la fonction f(x)? 


Rappelons que la taille de la période d’échantillonnage h de la fonction f(x) va déterminer la 
taille du domaine de représentation de la transformée de Fourier F(t) dans l’espace réciproque. 
Ajoutons que la taille du domaine de définition de f(x) déterminera la taille de la fréquence 
d’échantillonnage r dans l’espace réciproque. Au fond, chaque fois que l’on traite de transformées 
de Fourier, il est indispensable d’avoir présent à l'esprit la figure 16.1. 

La détermination de la période d’échantillonnage h, pour une expérience donnée, n’est pas 
un problème banal : il n’est pas question d'effectuer un échantillonnage de n'importe quelle 
façon quand bien même ne serions-nous pas intéressés par la partie de la transformée de Fourier 
au-delà d’une certaine valeur de l’abscisse fm. 

Il y a deux façons de procéder avec une fonction f(t), laquelle a fait l’objet d’un enregistrement 
continu, afin d'obtenir une bonne période d’échantillonnage dans l’espace direct. 


11.1. Détermination expérimentale de ho 


On effectue un échantillonnage à la période h puis on calcule la transformée de Fourier F(w). 
Pour que F(w) appartienne à L! ou L?, il est nécessaire qu’au moins elle soit nulle à linfini, 
c’est-à-dire au bord du domaine (—0, 5, +0,5). (Elle peut évidemment devenir nulle avant le 
bord...) 

Si tel n’est pas le cas, on modifie le pas d’échantillonnage h pour s’assurer de la nullité de 
la fonction F(w) au-delà de ||. Bien entendu, on a tout intérêt à ce que l’annulation, dans 
l’espace normalisé, s’effectue au bord du domaine (—0,5, +0,5) et non à l'intérieur pour la 
bonne raison qu’il est inutile de réaliser des calculs qui n’apprennent rien sur la TF. Dans ces 
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conditions, on déduit que l'étendue de l’espace réciproque est (—wo, +wo) soit 2wo et que la 
fréquence d’échantillonnage est : 


2w0 
Pen 
il s'ensuit que la «bonne période » d’échantillonnage ho est donnée par l'expression : 
1 
ho = == 
9 2wo 


c’est la période d’échantillonnage de Shannon (1916- ). Autrement dit, il faut échantillonner à 
une fréquence au moins deux fois plus grande que la plus grande fréquence apparaissant dans 
le signal à traiter pour ne rien perdre de l'information contenue dans le signal. Quand cette 
condition est remplie, Shannon a montré que l’on pouvait effectuer une interpolation rigoureuse 
G(w) dans l’espace réciproque de la fonction F(w) au moyen de la relation : 


+00 : ir 
Gw)= J. Flkro) e mE | 


k=- 


Démonstration — On isole une période a de la fonction f(t) de l’espace direct en la multipliant 
par une «fonction porte » r(t) : 


La transformée de Fourier de g(t) notée G(w) est continue, périodique et définie numérique- 
ment pour les valeurs w = kro : 


G{w) = F(w) x R(w) (produit de convolution), 


où R(w) est la transformée de Fourier de la fonction porte, soit : 


_ sin(2rTw) 
ROLE 2rxTw ’ 
de là, nous tirons : 
pia sin[27T(w — kro)| 


G(w)= X` F(kro) 


k=-—00 


27 T(w — kro) 


11.2. On impose ho 


Dans ce cas, il est indispensable de procéder au filtrage du signal avant de l’échantillonner et il 
ne devra pas comporter de fréquences supérieures à : 


sous peine de voir apparaître dans le spectre des «battements » avec la fréquence d’échantillon- 
nage. C’est réellement ce problème qui est traité dans la réalisation d’un disque numérique. La 
fréquence d’échantillonnage est fixée aux environs de 45 kHz. Il s’ensuit que le signal ne doit pas 
comporter de fréquences supérieures à 22,5 kHz ou tout au plus ces fréquences, si elles existent, 
auront une amplitude très atténuée — au moins 20 dB par octave. 
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Si tel n’est pas le cas, supposons alors qu’il existe, par exemple, dans le signal une fréquence 
de 30 kHz. Nous verrons, ou plutôt entendrons, une fréquence résultant du battement de 
cette fréquence avec la fréquence d’échantillonnage, c’est-à-dire 15 kHz. On comprend très 
bien que toutes les fréquences comprises entre 22,5 et 45 kHz vont battre avec la fréquence 
d’échantillonnage et recouvrir le spectre qui a été obtenu entre 0 et 22,5 kHz. C’est ce que 
certains auteurs appellent le «repliement du spectre ». 

On comprend tout le danger qu’il y a à effectuer un échantillonnage sans connaître la plus 
grande fréquence composant le signal et qui soit non négligeable en amplitude. 


12. La distribution de Dirac (1902-1984) 


La distribution de Dirac joue un rôle intéressant dans l’étude des transformées de Fourier, et 
l’on consultera avec intérêt l'ouvrage d’Arsac sur les transformées de Fourier des distributions 
tempérées. 


12.1. Définition 
On considère la suite de fonctions : 
1 
=0 si x<0 et rx >— 
falz) 1 X 
=n si 0<zxr< n 


La distribution de Dirac, notée ô(x), est la limite de f,(x) lorsque n tend vers l'infini. ô(x) est 
encore appelée impulsion unité car sa surface est égale à 1 (comme toutes les fonctions f,(x) 
par construction). L'intégrale de la fonction de Dirac est notée Y (t) : 


Y(t) = IRG dz, 


elle vaut 1 sit > 0 et 0 si t < 0. Elle s'appelle fonction de Heaviside (1850-1925) ou échelon 
unité. 


12.2. Quelques propriétés 


a- 


b — De même, si a < 0 et b > 0, on peut écrire : 


b 
J f(æ)ô(æ) dx = f(0), 


car (x) est nulle partout sauf en z = 0. 
Réciproquement, la dérivée de la fonction de Heaviside est la fonction de Dirac. 
Y (t) est encore appelée la fonction échelon unité. 
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c — Théorème — Dans l'algèbre de convolution, (x) joue le rôle d'élément unité : 
T*f=f. 


Par exemple, 
+00 +0 
f EE E de f ee e 


a(x) étant la fonction 6(x) qui a subi la translation a. 
d — Transformée de Fourier de ô(x) et propriétés connexes 
1. La transformée de Fourier de la fonction f(x) = 1 est la fonction de Dirac. 


-+00 
| lexp(2rjvt) dt = ô(v) 


— O0 


2. Réciproquement : 


+00 
J ô(v)exp(—2rjvt) dv =1. 


O0 


Remarque : Considérons la fonction ô (t) à qui l’on fait subir deux translations symétriques 


+a : 
1 1 
zêl a) EZ 5 exp(—2rjav) 
1 TF 1 f 
ot +a) > 5 exp(2rjar) 


En additionnant membre à membre, on obtient : 


5 Bt+a)+ét-e) -< cos(2rar) 
Si ft) + Ft), 
alors : 
+00 
J roe akari) 
a 
et I ô(t— a) f(t)exp(—2rjvt) dt = F(a) 
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12.3. La fonction « peigne » de Dirac encore appelée sha(t) 


On peut montrer que la fonction (distribution) DE. ô(t — k), avec k entier est sa propre 
transformée de Fourier. On en déduit ensuite la formule de Poisson : 


laquelle permet d’écrire : 

OO (ee) 

XO ôlt-k)= X` exp(—2rjtn). 

k=- n—=—00 
La fonction sha(t) permet de représenter la fonction d’échantillonnage d’une fonction quelconque 
à la fréquence Fe (ou à la période Te) : 
sha(t) =T, X. ô(t- kF,). 
k=—00 


Soit f(t) la fonction que l’on désire échantillonner dont la forme échantillonnée s’appelle &(t) 
et dont la transformée de Fourier est F(v) : 


D(t) =Te XO F(RT)E(t-RTe) = f(t)Te XO 6(t—KTe). 
k=—00 k=- 
La formule de Poisson permet d’écrire : 


+oo 
S(t)=F(v)x X 6(v-nF.). 


n=— OO 


13. Transformées de Fourier multidimensionnelles 

Il n'y a pas de difficultés à traiter des transformées de Fourier à plusieurs dimensions, car les 
grands principes que nous avons évoqués à propos des transformées de Fourier à une dimension 
demeurent. Nous allons nous intéresser aux transformées à deux dimensions dont l'intérêt évident 


concerne le traitement des images, quoique d’autres applications soient également bien utiles. 
Dans un espace cartésien à deux dimensions, la transformée directe s'écrit : 


+00 
fluv) = f] Gtau) explers(uz + vy) dz dy 
— CO 
ainsi que la transformée réciproque sous réserve de son existence : 


G(x, y) = J| Cu 0 exp t-2niQur + vu) du dv. 


— 00 
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Il est possible encore d'écrire : 


+oo +oo 
fau) = f 4 Gtau)expterue) de } expl2rjuy) du 


+œ f +œ 


et cen= | J Foel -2rjuz)du exp(—2rjvy) dv. 


— CO — 00 


Dans la pratique, le domaine D d'intégration est fini et rectangulaire dans un espace cartésien. 
Il s'ensuit que l’on pourra utiliser l’algorithme de Cooley-Tukey en effectuant un maillage du 
domaine D qui comporte 2” points sur l’axe des x et 2™ points sur l’axe des y. 

Ainsi on calculera toutes les transformées de Fourier ligne à ligne suivies de toutes les 
transformées effectuées colonne à colonne. Cela nécessite un aménagement de la transformée 
de Fourier à une dimension en ce sens que les adresses des éléments ainsi que la table des 
cosinus ne sont à calculer qu’une seule fois pour chacune des deux dimensions. 

Sur le Web (+) on trouvera le sous-programme dfft2.h qui réalise la transformée de Fourier 
directe à deux dimensions. La transformée réciproque dfftinv2.c est obtenue en modifiant ce 
programme de la façon suivante : on supprime la normalisation, puis on change convenablement 
les signes exactement de la même manière que ce qui a été fait à propos des transformées à une 
dimension. 
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17 | Initiation aux problèmes mal 
posés : équations intégrales, 
systèmes linéaires mal 
conditionnés et équations 
de convolution 


La résolution numérique de certains problèmes mathématiques peut amener un type particu- 
lier d’ennuis lié à l'instabilité des solutions vis-à-vis de faibles variations des données initiales. 
En d’autres termes, des variations des données aussi petites que l’on veut peuvent amener des 
variations aussi grandes que l’on veut de la solution. C’est bien ce type de problème qui est évoqué 
par les météorologistes quand ils disent qu’un battement d’aile de papillon peut provoquer un 
cyclone n'importe où... 

Grosso modo, la solution approchée de ce type de problème n’est pas unique dans les limites 
de précision que l’on s’est fixé et devient difficile à interpréter. 

C’est Hadamard (1865-1963) qui le premier a mis en évidence ce type de problèmes, dits mal 
posés aujourd’hui, et l’on trouvera en bibliographie ses articles originaux. On peut ajouter que 
ces problèmes ont fait l’objet d’une récente actualité au cours du développement de la théorie 
du chaos. 

Ce chapitre doit énormément à l’ouvrage de référence écrit par Tikhonov (1906-1993) et 
Arsénine aux Éditions de Moscou (cf. bibliographie). La lecture de ce livre demande une solide 
connaissance en mathématique, et nous avons seulement cherché dans ce chapitre à résumer la 
philosophie sous-jacente. Cependant, dans une première approche de ces problèmes, la lecture 
des exemples et l’usage des programmes sont amplement suffisants. 


1. Un exemple de problème mal posé : le calcul des séries de Fourier 
à coefficients approchés dans L? 


Considérons une série de Fourier convergente que nous écrivons : 
OO 
f(x) = 5 an cos(nx) 
n=0 


et supposons que chaque coefficient a, soit entaché d’une erreur e/n (à l'exception de ao 
évidemment) ; nous écrivons donc : 


Cn = An +E/N et Co = ap. 


La fonction f(x) est donc remplacée par la fonction g(x) : 


g(x) = 5 Cn Cos(nx). 
n=0 
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Dans la métrique de L?, les coefficients diffèrent de : 
na 1/2 Si 1/2 
ET 
E = Cn — An f = € — = —, 


par conséquent, E; est aussi petit que l’on veut. D'autre part, si la distance entre les fonctions 
f(x) et g(x) est donnée par la norme de la convergence uniforme, nous avons : 


sup g(e) — fæ) = sup e5 EP] LL 
n=1 n=l 


cette quantité est aussi grande que l’on veut. 


Remarque : Si l’on choisit la norme de la convergence en moyenne quadratique, le problème 
devient bien posé. En effet : 


2. L’équation intégrale de Fredholm (1866-1927) de première espèce 


L'équation de Fredholm de première espèce constitue un problème mal posé. Considérons 
l’équation fonctionnelle suivante : 


b 
fke t)z(t) dt = u(x) pour x appartenant à (c,d), 


expression dans laquelle z(t) est une fonction inconnue de l’espace F des fonctions continues 
sur (a,b) et u(x) une fonction connue de l’espace U. Mentionnons au passage que l'équation de 
convolution est un cas particulier de cette équation fonctionnelle, K(x, t) devenant K (g, —t). 

Ajoutons une hypothèse supplémentaire sur le noyau K (z, t) qui est connu : c’est une fonction 
continue en g qui possède une dérivée partielle 0K(x,t)/0x également continue. 

Si la solution n’est qu’une solution approchée, la mesure de l’écart du second membre 
s'effectue, par exemple, dans une métrique quadratique 4u que nous écrivons (U est l’espace des 
fonctions de carré sommable L?) : 


d 1/2 


pulu, ue) = I fun (e) = uz(2)]? de 


c 


L'écart de la solution z(t) peut être mesuré, par exemple, dans la métrique y, de la convergence 
uniforme (F est l’espace des fonctions L®) : 


Hz(z1, z2) = sup |z(t) — z2(t)| pour t appartenant à (a,b). 
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À présent, montrons que le problème est un problème mal posé. Supposons que pour un second 
membre u1(x) nous connaissions une solution exacte z1(t); on peut alors écrire : 


b 
ECO dt = w (z). 


Maintenant, supposons que l’on connaisse un second membre approché peu différent de u(x) 
dans la métrique L?, et l’on se propose de rechercher une solution voisine de z1(t). 
Considérons la fonction z2(t) = 21(t) +T sin(wt), elle est solution de l’équation : 


b 
r i K(x, t)sin(wt) dt + u(x) = ug(x). 


Cette expression permet de calculer la distance de {u1(x) — u2(x)] : 


1/2 
d 2 / 


b 
Hu (ui, u2) = |I] f f Kensin dt dx | 


e 


cette expression peut être rendue aussi petite que l’on veut pourvu que w soit suffisamment 
élevé. Calculons maintenant la distance des solutions correspondantes : 


uz(21, 22) = suplai(t) — z2(t)| = sup|I sin(wt)| = |T| pour t appartenant à (a,b). 


et cet écart pourra être arbitrairement grand. 


Remarque : Rien n’est changé si la norme y,(21, 22) est remplacée par l’autre norme (21, 22); 
on calcule alors : 


1/2 
b 2 / b 1/2 


E EN i A2) aN i Î sin/(ut) dt 


a a 


= 1/2 
= |I] | 5 = sin[w(b — a)] cos[w(b — a)l| ; 


Cette dernière expression montre que T et w peuvent être choisis de telle façon que la distance 
Hu(z1, 22) puisse être arbitrairement grande. Ici le problème n’a pas été modifié par le choix de 
la norme, mais ce n’est pas une loi générale. 


La conclusion peut s’énoncer de la manière suivante : la recherche d’une solution de l'équation 
intégrale ne peut pas être déterminée par la condition : 


Hu(Az;u) < ô 
expression dans laquelle : 


a. l'opérateur intégral est désigné par À, ce qui permet d’écrire formellement Az = u à la place 
de l'équation intégrale. 
b. ô est un infiniment petit positif. 
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3. Notion de problèmes bien et mal posés 


Résoudre le problème linéaire Az = u, c’est trouver sa solution z = R(u) à partir des données 
initiales u(x). Il va de soi que l’on travaille dans des espaces métriques et que la distance est 
suggérée par le type de problème traité. 

Supposons que la «solution » soit définie, et qu’à tout u appartenant à U corresponde une 
solution unique z = R(u) appartenant à F. 

Par définition, on dit que le problème de la recherche d’une solution est stable vis-à-vis des 
données initiales si Ve > 0, il existe (€) > 0 tel que : 


Hulur, u2) < Ô(E) entraîne 4,(21,22) <€ 


avec 21 = R(w) et z2 = R(u2), 


u1 et uz appartenant à U et zı et z2 appartenant à F. 
Par définition, le problème est bien posé sur les espaces U et F si l’on vérifie les conditions 
suivantes : 


1. Vu appartenant à U, il existe une solution z appartenant à F. 
2. La solution est définie de façon unique. 
3. Le problème est stable sur les espaces U et F. 


Dans le cas contraire, on dit que le problème est mal posé. 


Quelques remarques 


1. Le rôle de la troisième condition est fondamental pour l'exploitation des méthodes numériques. 

2. La recherche d’une solution approchée d’un problème mal posé est généralement non uni- 
voque. Supposons que l'équation Az = u soit mal posée dans l’espace des fonctions F, même 
si À est un opérateur absolument continu, A7! ne sera pas en général un opérateur continu 
sur U et la solution ne sera pas stable. De plus on suppose que le second membre Uap est 
connu à ĝ près tel que Hu(Uex, Uap) < Ô, (Uez étant la solution exacte et tap étant la solution 
approchée). Naturellement on recherche la solution approchée dans la classe Qs de z pour 
laquelle la distance uu(Az,uap) < ô; malheureusement, la classe Qs est en général trop 
vaste et il faut introduire une contrainte c’est-à-dire un principe de sélection sur les solutions 
possibles. Pour ce faire, on exploite une information supplémentaire sur la solution qui peut 
être par exemple la régularité des solutions. 


4. Méthode de régularisation 


À présent nous envisageons le cas où F la classe des solutions possibles n’est plus compacte, ainsi 
les variations du second membre de l’équation Az = u sont susceptibles de sortir des frontières 
de AF ; on dit alors qu’il s’agit de problèmes essentiellement mal posés, et A. Tikhonov a proposé 
une méthode de résolution fondée sur la notion d’opérateur régularisant. 


4.1. Notion d'opérateur régularisant 


L'opérateur A1 n’est plus continu sur AF et l’ensemble des solutions de F n’est plus compact. 
Même dans le cas où l’on est en présence d’un second membre approché Uap appartenant à U 
tel que Hu(Uex, Uap) < ô, on sait que la solution : 


— 4-1 
Zap = À Uap 
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n’approche pas la solution Zey. Pour pallier cet inconvénient, on définit un opérateur régularisant 
qui dépend de 6, de telle sorte que, si Uap tend vers uw, c’est-à-dire que à tend vers zéro cela 
doit entraîner que Zap tend vers Zey dans les métriques appropriées. 


Définition — On dit que l'opérateur R(u, 6) est régularisant dans le voisinage de u = Uez pour 
l'équation Az = u, s’il possède les propriétés suivantes : 


1. Il existe #, > 0 tel que R(u, d) soit défini quel que soit ô € (0,41) et pour tout us tel que 
Hu (Uex us) <ô. 
2. Quel que soit € > 0, il existe o(E, Uez) < 01 tel que l'inégalité : 


HulUes ug) < Ô < ôo entraîne l'inégalité : pz(2Z5, Zer) <E avec 25 = R(us, 6). 


On note que nous ne faisons pas l'hypothèse d’un opérateur univoque, il peut exister un 
ensemble {R(us,6)} et 25 est un de ces éléments. 

À la place de 6, on peut substituer un paramètre de régularisation noté œ (a > 0), qui permet 
d'apporter une définition plus commode. 


a. R(u, a) est défini quel que soit œ > 0 et pour tout us € U tel que : 
Hu(üezs US) <ô <e. 


b. Il existe d’une part a fonction de à tel que, quel que soit € > 0, et il existe d’autre part 
ô(£) < ô tel que si uş € U et HulUez, ug) < Ô(E), cela entraîne : 


Hz(25, Zex) < E€ avec Zap = Rf[us, a(ô)]. 


On choisit comme solution approchée la solution z5 obtenue au moyen de l'équation z5 = 
R[us,a(ô)], équation dans laquelle le paramètre régularisant est lié à lerreur entachant les 
données initiales us. 

Il nous reste donc à chercher des opérateurs régularisants et à définir le paramètre «a 
connaissant l'erreur ô entachant le deuxième membre. 

Nous n’allons pas rentrer dans les détails de l’obtention d'opérateurs régularisants dont nous 
donnerons quelques exemples en nous limitant aux idées générales. La construction d'opérateurs 
régularisants est fondée sur le principe variationnel qui minimise une fonctionnelle stabilisatrice 
Q(z) non négative continue et définie sur un sous-ensemble F; dense partout sur F. En outre, 
cette fonctionnelle est telle que l’ensemble des éléments z de F; pour lesquels Q(z) < ô quel que 
soit ap > 0 est un compact sur F1. On cherche la solution approchée dans l’ensemble M de F 
tel que : 


Hu (A2, us) < ô, 


comme la solution n’est pas continue en 6, on ne peut pas retenir un élément arbitraire de M. En 
général, M est très grand et c’est notre principe de sélection variationnel qui va nous permettre 
de choisir un ou plusieurs éléments de M qui dépendent continûment de 6. 

Revenons à notre fonctionnelle stabilisatrice Q(z) définie sur l’ensemble F} de F et désignons 
par Fj l’ensemble des éléments de M sur lequel Q(z) est défini; nous pouvons écrire : F5 = 
M N F1. L'exploitation du principe de sélection consiste à rechercher les éléments de Fis qui 
minimisent la fonctionnelle Q(z). 
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Dans le cas général, il est possible de montrer que, plutôt que de chercher à minimiser la 
fonctionnelle stabilisatrice Q(z) sur Fis, il est équivalent de chercher à minimiser Q(z) sur F 
avec la contrainte : 


Hul Az, Us) = ô. 


Ce problème se traite au moyen de la méthode des multiplicateurs de Lagrange (1736-1813). 
Autrement dit, nous minimisons la fonctionnelle suivante : 


Ma(z, us) = u (Az, us) QE aN(z), 


cependant, il faut qu’il existe un paramètre a et un élément Za tels que non seulement Ma(z, us) 
atteigne sa borne inférieure, mais encore qui assurent la condition : 


Hul Aza, ug) = ô. 

On peut introduire formellement la fonctionnelle Ma(z, us) et chercher l'élément z, suscep- 
tible de constituer le minimum sur F) et alors, le paramètre a qu’il convient de déterminer 
se présente comme une fonction de 6. D’une façon générale, Ma(z, us) s'appelle fonctionnelle 
lissante. 


Il est tout à fait équivalent de considérer que Za est donné par l'application d’un certain 
opérateur Rus, a(ô)] dépendant de tel que : 


26 = Rlus, a(ô)], 
où a se détermine au moyen du résidu comme on le verra dans le paragraphe 4.4 qui suit. 


Le choix de la fonctionnelle stabilisatrice est guidé par la nature du problème à traiter et cela 
sera mis en évidence sur les exernples que nous présenterons. 


4.2. Théorème important (sans démonstration) 
Si un sous-ensemble ġ de F admet une métrique u4(21,22) qui majore la métrique up(z1, 22), il 
est possible de montrer que, sous réserve que la sphère ue(z, 20) < p (de centre zo) soit compacte 
dans F, il existe alors un élément Za appartenant à d qui minimise la fonctionnelle : 
M(z,us) = p2 (Az, us) + aQ(z), avec Q(z) = (2, 0). 
a — Exemple 1 — Si F est muni de la métrique : 
ur(4,22) = sup|a(x) — z2(x)| 


pour x appartenant à (a,b), il est possible de choisir l’ensemble @ des fonctions continâment 
dérivables sur (a,b) muni de la métrique : 


(2,22) = sup {|z1 (2) — z2(2)| + [z1 (2) — 2(x)|} 


pour z appartenant à (a,b). 
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b — Exemple 2 -— Si F, espace des fonctions continues sur (a, b), est muni de la métrique : 
Lr (z1, z2) = sup |z1 (£) — z2(x)| 


on peut choisir l’ensemble 6 des fonctions de carré sommable qui admettent des dérivées jusqu’à 
l'ordre p sur (a,b) (espace de Sobolev (1908-1989) WF) muni de la métrique : 


pale, 22) = j Date) (5e) de 
S k=0 


expression dans laquelle les q(x) sont des fonctions continues connues > 0, avec toutefois 
qp(£) > 0. On aura donc : 


1/2 


)= j Sal) (SD) ar, 
J k=0 


et comme la solution régularisée z, minimise la fonctionnelle stabilisante Q(z) avec la contrainte 
Hul Aza, us) = ô, alors, la solution sera approchée par les fonctions les plus lisses jusqu’à l’ordre p. 

Les stabilisateurs s’appellent dans ce cas stabilisateurs d'ordre p, et si les fonctions q(x) sont 
des coefficients constants > 0, on parle alors de stabilisateurs d'ordre p à coefficients constants. 


4.3. Recherche de la solution régularisée sous forme d’une série 


On suppose ici que À est un opérateur complètement continu de F dans U, et que U et F sont 
des espaces hilbertiens. En outre, on suppose que le sous-ensemble 6 de F est aussi un espace 
hilbertien qui est muni de la métrique majorante ||z|| pour laquelle l’ensemble des éléments z 
de ®, tels que ||z|| < d, est compact dans F. On peut alors prendre comme stabilisateur la 
fonctionnelle : 


X2) = lel? 


Puisqu'il s’agit d’un problème variationnel, on écrit l'équation d’Euler associée à la fonction- 
nelle lissante Ma(z, u). On montre qu’elle se met sous la forme : 


A* Az + az = A*u, 


où A*A est un opérateur auto-adjoint. 
Si l’on désigne par {fk} un système complet de l'opérateur A*A (vecteurs propres) et par 
{Az} les valeurs propres associées, on peut mettre A*u sous la forme d’une série : 


œœ 
A*u = 5 Ck Ík, 
k=0 


et z sous la forme : 


z= S befe 
k=0 


expression dans laquelle les {b} sont donnés par les expressions : 
= Ck 
E Ak +a 


bk 
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4.4. Choix du paramètre de régularisation 


Il n’est pas évident de connaître la fonction a(ô) pour laquelle l’opérateur Rlus, a(6)] soit 
effectivement régularisant, cependant, on connaît une valeur de ô caractérisant l’imprécision 
générale et il nous faut trouver une valeur correspondante de à choisie parmi les valeurs possibles. 
On connaît la valeur ô d’après la relation : 


Hu(Uex, us) < ô. 
Alors, on peut estimer œ d’après le résidu, c’est-à-dire au moyen de la condition : 
Hul Aza, us) = ô. 


D'un point de vue pratique, on va opérer de la façon suivante : 


1. On estime ô l’erreur sur le second membre. 
2. On va choisir une suite de valeur de a qui sont en progression géométrique, soit : 


k 
Qk = 0q 


et pour chaque œx on calcule la valeur de la fonction za, qui minimise la fonctionnelle lissante 
Ma, (2, us). 
3. On calcule le résidu rx au moyen de la relation : 


Tk = Hu( Aro U). 
4. Pour valeur de à, on choisit celle pour laquelle on vérifie légalité : 
Hul AZap U6) = ô. 


5. La méthode donne l’idée concernant la façon dont il faut choisir &ọ. En programmation, il 
est commode de procéder par tâtonnements de façon conversationnelle, afin de déceler plus 
rapidement les ordres de grandeur. 


5. Application à la résolution approchée des équations intégrales 
de Fredholm de première espèce 


Revenons à l'équation de Fredholm de première espèce : 


b 
f (CDD Eu) 


pour z appartenant à (c,d), et u(x) appartenant à l’espace L? des fonctions de carré sommable. 
Pour obtenir la solution, nous allons utiliser un stabilisateur du premier ordre dans l’espace de 
Sobolev W4. Nous cherchons la solution za qui minimise la fonctionnelle : 


b 


a j j K (x, t)z(t) dt — u(x) | TEN J faoto + at) ( zey) dt. 


€ 


a 
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Il est possible de montrer que la solution régularisée est donnée par la résolution de l'équation 
intégro-différentielle : 


avec : 


d 
H(x,t) = IEC z)K(y,t) dy, 


d 
b(z) = | K (y, z)u(y) dy, 


expressions auxquelles il faut ajouter la condition : 


q(x)z'(æ)u(x)là = 0, 


où v(x) est une variation arbitraire de z(x) telle que z(x) + v(x) puisse appartenir à la classe 
des fonctions admissibles. 


On peut satisfaire cette condition de deux manières : 


a. on connaît les valeurs de la solution aux bornes de l'intervalle (a,b) et il faut que la fonction 
v(x) s’annule à ces extrémités ; 

b. si ces valeurs ne sont pas connues, on peut alors poser z/(a) = z'(b) = 0, ce qui constitue 
deux contraintes à imposer à la solution approchée. 


5.1. Résolution numérique 


Comme chaque fois en pareil cas, on procède à un maillage du domaine sur lequel on désire 
effectuer la résolution de l’équation intégro-différentielle. Généralement on adopte un maillage 
uniforme de pas h sur l'intervalle (a,b), ainsi la solution 2(x) est calculée pour les valeurs 
en progression arithmétique xx; = a + kh avec k = 0,1,2,...,n et nous notons 24 la valeur 
inconnue 2(x4). Nous pouvons également écrire quelques expressions utiles pour la formulation 
du problème transposé sur le plan numérique : 


b 


| K(akt)2(0) dt =h Ý Kywz, 


a v=0 


l'expression du second membre représentant formellement une technique d'intégration usuelle 
(trapèze, rectangle, Simpson...). 
Puis, en utilisant les opérateurs de différences première et deuxième : 


a £ late) ze] = s [q1 (£k)(Zk+1 — Zk) — qı (£k-1)(2k — 2k-1)] 


Q 
= 75 [qi kžk+1 + Qk-12k-1 — Zk (qik + Qik-1) — 2k-1)], 


et  ago(x)z(x) = aGok2k. 
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Ainsi, nous pouvons écrire un système d'équations aux différences finies : 
V 
a 
h X Kk uzv — ro [Qi,k2k+1 + Quk-126-1 — 2k(Q1,8 + Qi,k-1) — 2-1] + QQo,k2k = bk 
p=0 


pour k = 1,2,...,n — 1. On obtient donc un système de n — 1 équations à n — 1 inconnues à 
partir du moment où l’on connaît zo et Zn. 

Si l’on ne connaît pas 20 et Zn, on pose z/(a) = z'(b) = 0, et ces conditions seront imposées 
en écrivant le système pour k = 0,1,2,...,n, et l’on posera z_1 = Zo et 2n+1 = Zn. Ceci assure 
que les dérivées numériques en a et b sont nulles. 

Ici encore, il faut résoudre chaque fois un système linéaire pour une valeur de a. Pour 
déterminer la solution, on peut utiliser la méthode du résidu. 


5.2. Exemple numérique 


On se propose de résoudre numériquement l’équation de Fredholm de première espèce suivante : 


+1 
Î Keak dy = u(a) 


avec K(r,y)=(10—-x)y si 0<y<x 
K(x,y) = (1.0 — y)x si z<y<l 
et u(x) = [sin(rx)|° sur l'intervalle (a,b) = (—1, 1). 
La solution est connue analytiquement, et l’on la comparera aux résultats numériques : 


3 ; 
u(y) = 1 (sin(rx) — 3sin(3rx)|. 
On trouvera sur le Web®) le programme fredh_1.c qui résout ce problème dans lequel les 
intégrales sont évaluées au moyen de la méthode de Simpson. 


6. Résolution d’un système linéaire mal conditionné 


Soit AX = B un système linéaire le plus général. Nous considérons ici les systèmes d'équations 
algébriques pour lesquels de petites perturbations du second membre peuvent induire des 
variations inacceptables de la solution. Il se peut également que la matrice À ait un déterminant 
très proche de zéro, dans ce cas, comme les calculs sont effectués avec une précision finie, nous 
ne serons pas en mesure de savoir si le système est réellement dégénéré ou non. Quoi qu’il en 
soit, il existe une classe de systèmes linéaires qui sont indiscernables entre eux pour un niveau 
d'erreur connu. 

On va rechercher la solution, appelée solution normale, parmi les vecteurs X qui vérifient 
l'inégalité : 


1/2 
avec : [Z] = De ; 


*http://wuw.edpsciences.com/guilpin/ 
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L'application de la méthode des régularisants nous conduit à minimiser la fonctionnelle 
lissante : 
Ma(X, uap, A) = [AX — wap]? + a[X}?, 
a se déterminant par la condition : 
[AXa — Uap] = ô. 
Sans entrer dans les détails, on obtient le système linéaire : 
(ATA + al) = ATuap 


expression dans laquelle AT est la matrice transposée de À, et I la matrice unité d’ordre identique 
à celui de À. Généralement, ici encore, œ se trouve déterminé par le résidu. 


Remarque : On peut traiter d’un système linéaire surdéterminé mais dont les équations 
normales sont mal conditionnées. Nous avons rencontré un tel problème lors du lissage de 
diagrammes de phase binaires dont les données sont expérimentales. 


On trouvera sur le Web(*) le programme regul.c qui résout les systèmes linéaires mal 
conditionnés par la méthode des régularisants. 


7. Résolution des équations de convolution 


C'est une équation de toute première importance en physique dans la mesure où le signal 
observé u(t) est le produit de convolution du signal émis z(t) et de la fonction d'appareil K (t). 
Ce sont des problèmes classiques rencontrés en spectroscopie, en astronomie etc. Nous nous 
proposons de résoudre l’équation : 


+00 
f K(x — t)z(t) dt = u(x), 


c'est-à-dire de calculer z(t) connaissant K (t) et u(x). On peut encore écrire : 
Az = u. 


Le problème se résout très facilement en termes de transformées de Fourier sous réserve que 
les fonctions appartiennent à l’espace L! ou L?. Le produit de convolution devient un produit 
simple dans l’espace de Fourier : 


d’où 


v 
et 4 E ew, 
+00 
avec:  D(w) — f EO erp2riut dt. 


* http://www .edpsciences .com/guilpin/ 
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Sur le plan formel, pourvu que les fonctions appartiennent aux bons espaces, il n’y a rien à 
reprocher à une telle façon de faire ; en revanche, si l’on doit s’attaquer à la résolution numérique 
d’un tel problème, on va se heurter à un problème mal posé. 

Il est facile de s’en convaincre en choisissant deux fonctions arbitraires, une fonction gaussienne 
g(t) et une fonction triangle tri(t) par exemple, dont on réalise le produit de convolution u(t), 
le sup de chacune des fonctions étant égal à un. Si l’on utilise d’une part une machine dont la 
précision est de 10 chiffres significatifs et d'autre part la transformation de Fourier portant sur 
128 points, la résolution de l'équation de convolution est parfaitement réalisée. En revanche, 
si l’on introduit dans le second membre une erreur relative gaussienne de l’ordre de un pour 
mille — il s’agit d’un bruit très faible noté e(t) — alors les résultats deviennent complètement 
aberrants : au lieu de trouver des résultats entre 0 et 1 approximativement, on obtient des 
valeurs oscillantes entre —26 et +34 et une quinzaine d’oscillations… 

Ceci montre que la résolution numérique des équations de convolution ne peut pas donner de 
résultats corrects si l’on ne prend pas la bonne méthode d’analyse car les données expérimentales 
sont toujours entachées d'erreur. 

L'origine des ennuis est relativement simple à identifier : elle est due aux «hautes fréquences ». 
Désignons par #{(w) la transformée de Fourier de e(t), la transformation inverse de 0(w)/K(w) 
peut ne pas exister, c’est-à-dire que cette intégrale peut diverger, ceci étant essentiellement dû 
au rôle des hautes fréquences. Cependant, quand bien même la transformation inverse existerait 
notée w(t), l'écart de w(t) par rapport à zéro peut être aussi grand que l’on veut dans la métrique 
L? ou L”. 


7.1. Présentation d'un opérateur régularisant 


Pour neutraliser l'influence des hautes fréquences, on peut multiplier la fonction à inverser 
U(w)/K(w) par un facteur stabilisant f{w,a). Ainsi, on admettra sans démonstration que 
l'opérateur suivant est régularisant : 


+00 
Riula = | À cree Nude 


pourvu que la fonction f(w,a) obéisse aux conditions suivantes : 


F(w, a) est définie quel que soit œ > 0 et quel que soit w € (—00, +00). 

. 0 < f(w, a) < 1 quels que soient a > 0 et w € (—00, +00). 

f(w,0) = 1. 

f(w, a) appartient à l’espace L?, et quel que soit œ > 0, f(w, œ) est une fonction paire de w. 

f(w, a) tend vers zéro quand |w| — co, quel que soit & > 0. 

flw, a)v(w) 
K(w) 

f(w, a) tend vers zéro quand a — œ, pour tout w différent de zéro. 


appartient à l’espace L?, quel que soit a > 0. 


INT SON ca RU 


7.2. Un exemple de fonction f(w, œ) 


K(-u)K(a) Kw) 
K?(w)+aM{(w)  K?2(w) +aM(w) 


fwa) = 
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où a > 0 et où M (w) est une fonction paire, continue, strictement positive pour w Æ 0 et positive 
ou nulle si w = 0. 

Il est possible de montrer que le résidu de la fonction régularisée est une fonction strictement 
croissante de la variable a, ce qui entraîne qu’il existe un nombre unique a tel que : 


Hul As uap) = ô 


à condition toutefois que ô < Hu(Uap)- 
On peut choisir pour M (w) une forme polynomiale que lon écrit : 


P 
M{w) = y yw”, 
j=0 


expression dans laquelle les +; sont des constantes positives (éventuellement nulles sauf yp). 
Cette forme introduit des stabilisateurs d’ordre p. En définitive, la solution régularisée s’écrit : 


+20 
K(-w)u(w) f 
t) = 2rjwt) dw. 
Za(t) | K2{w) + aM(w) exp( Tjwt) dw 
-00 
ici encore, œ pouvant être déterminé par le résidu. 
On trouvera sur le Web®) le programme dconvol.c qui réalise cet algorithme. 
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18 |Introduction aux méthodes 
de Monte-Carlo 


Les méthodes de Monte-Carlo sont apparues comme moyen de recherche durant la Seconde 
Guerre Mondiale afin de simuler le comportement des neutrons dans les matériaux fissiles. La 
paternité de cette idée revient à J.E. Mayer qui l’utilisa pour la première fois en physique 
statistique. 

Avec le développement des calculateurs arithmétiques, il est très facile de réaliser quelques 
simulations de ce type à l’aide de générateurs de nombres pseudo-aléatoires. Après avoir 
présenté le célèbre problème de Buffon (1707-1788) comme illustration historique d’une méthode 
de Monte-Carlo, nous donnerons deux générateurs de nombres pseudo-aléatoires que nous 
utiliserons dans quelques applications classiques à savoir : 


— Calcul d’une intégrale définie. 

— Résolution locale de l’équation de Laplace. 
— Inversion d’une matrice carrée. 

— Recuit simulé (minimum d’une fonction). 


1. Le problème de Buffon 


Sur une feuille de papier nous traçons des parallèles équidistantes séparées par la distance 2a. 
Nous plaçons cette feuille sur un plan parfaitement horizontal, et nous jetons dessus une aiguille 
de longueur 2! telle que l < a. Le problème consiste à calculer la probabilité que l'aiguille 
rencontre une des parallèles (cf. Fig. 18.1, page suivante). Ce problème s’appelle aussi problème 
du drapeau américain, car durant la guerre de Sécession (1861-1865) un officier américain, lors 
de sa convalescence après blessure, s’était posé le même problème, la feuille de papier étant 
remplacée par le drapeau américain qui comporte des bandes équidistantes. 

Désignons par M le milieu de l’aiguille et par EF la perpendiculaire aux parallèles passant 
par M. Soit I le milieu de EF. On pose EM = x que l’on suppose inférieure à FM (M compris 
entre E et I). 

Pour que l’aiguille coupe la parallèle AB, il faut premièrement que x < l. Alors, la probabilité 
pour que M sur EI soit compris entre x et x + dx est : 


dg 
dpp =e 
a 
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Figure 18.1. Le problème de Buffon. 


Il faut deuxièmement que l’angle aigu EMQ soit plus petit que langle aigu EMQ' où Q’ est 
le point de AB tel que Q'M = l, soit : 


TE AN 
EMQ' = arccos ( i ) 
La probabilité pour que EMQ soit plus petit que EMQ' est alors : 


2 É ) 
p2 = ~ arccos | — |: 
T l 
2 doré . T 
— est le coefficient de normalisation car EM Q' est compris entre 0 et —. Comme dp; et pz sont 
des probabilités indépendantes, la probabilité dp de réaliser l'événement recherché est donnée 
par le produit des probabilités. Il reste à intégrer le long de ET c’est-à-dire de 0 à l, pour obtenir 
la probabilité p. Nous pouvons écrire : 


T 
pim T s l/a ar 


Dans le cas où l’on choisit ? = a/2, la relation précédente se simplifie : 


De 
T 


Le nom de Buffon est resté attaché à ce problème car ce fut le premier à en donner la solution 
correcte. Au Palais de la Découverte à Paris, cette expérience est effectivement montée et, 
comme on mesure p qui est le rapport du nombre n de cas où l’aiguille coupe une droite et du 
nombre total de lancements, on en déduit une détermination expérimentale de x. La première 
détermination selon ce procédé remonte à 1850 et fut réalisée par Wolff qui, avec 5000 lancers 
de l'aiguille, obtint la valeur 3,1596. 

Il est très simple de simuler ce genre de problème avec une machine arithmétique à condition 
de pouvoir disposer de nombres aléatoires obéissant à une distribution donnée. 


2. Générateurs de nombres pseudo aléatoires à distribution uniforme 


On peut obtenir de bonnes tables de nombres aléatoires à distribution rectangulaire (appelée 
aussi distribution uniforme) en prélevant dans le numéro de téléphone des abonnés pris dans 
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l’ordre alphabétique la suite des chiffres à condition toutefois d’en ôter le préfixe. Ces chiffres 
compris entre 0 et 9 sont approximativement aléatoires à distribution rectangulaire. 

On peut obtenir des résultats semblables en prélevant les chiffres successifs figurant sur les 
plaques minéralogiques des automobiles immatriculées en France pourvu que l’on ne s'intéresse 
qu’à ceux précédant les lettres. 

On peut également obtenir des suites intéressantes en choisissant les chiffres de nombres 
transcendants tels que e et m. Le procédé est coûteux car le calcul d’un grand nombre de chiffres 
demande un énorme travail préalable, y compris la transcription qui doit être sans faille. Il est 
important de noter que les chiffres des nombres transcendants tels que e et m n’ont aucune 
périodicité, mais, de plus, ils sont répartis aléatoirement selon la loi rectangulaire. Par ailleurs, 
on sait parfaitement calculer de très longues suites de chiffres exacts de ces nombres. En quoi 
ces suites générées sont-elles aléatoires? Elles le sont dans la mesure où connaissant uniquement 
les q premiers chiffres de la suite, il n’est pas possible de déterminer le q + 1° quel que soit q. 

Avec l’apparition des calculateurs modernes, la nécessité de pouvoir générer des suites de 
nombres pseudo-aléatoires s’est très vite manifestée. Il s’agit alors de créer une suite de nombres 
telle que la périodicité générée soit très grande devant la taille de l'échantillon à prélever. 

Une très bonne méthode due à Lehmer-Greenberger (1951 et 1961) consiste à former la suite 
à partir de la relation de récurrence : 


kiy1 = ak; +b modulo m 


avec les contraintes suivantes : 


1. b et m sont premiers entre eux, 
2. a = 1 modulo p pour chaque facteur premier p de m, 
3. a = 1 modulo 4 si m est un multiple de 4. 


Ainsi la période de la suite générée est m. 

Ces conditions sont très faciles à réaliser sur un calculateur binaire en arithmétique entière. 

Prenons le cas classique de la représentation sur quatre octets. Alors on sait que l’arithmétique 
entière est effectuée modulo m = 231. Attention en machine ce nombre est négatif, car le premier 
bit contient un 1. Ainsi le seul facteur premier de m est 2. Maintenant, pour satisfaire les autres 
conditions, il suffit de choisir b impair et a = 4k +1, k entier quelconque. Pour que le modulo m 
fonctionne dès les premières récurrences, il faut choisir des nombres ko, a et b de taille convenable. 
Nous avons retenu : 


ko = 223 
a = 125661 
b = 95 783. 


Remarque 1 : Il y a deux façons d'utiliser le générateur : en arithmétique flottante, on divise 
les k; générés par (—2*!) et l’on obtient des nombres compris entre —1 et +1. On peut aussi ne 
former que des nombres positifs compris entre 0 et 1, ainsi quand on rencontre un k; négatif, il 
suffit alors de lui ajouter (—2%1) pour le ramener dans les entiers positifs. Ensuite chaque k; est 
divisé par (—2*1). 

Remarque 2 : Nous avons vérifié expérimentalement que la période était bien 2°!. 


Remarque 3 : En utilisant le test du x?, nous avons vérifié que l’hypothèse de la distribution 
uniforme n’était pas contredite par les données générées. 
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Une autre technique pour obtenir une suite de nombres pseudo-aléatoires consiste à générer 
la suite suivante : 


Tis1 = Ti +zi-1 modulo 4 


avec zo = €e = 2,718 281 828 459 045 235... 
xı = 7 = 3,141 592 653 589 793 238... 


Elle donne des résultats tout à fait semblables à ceux fournis par le générateur de Lehmer- 
Greenberger. On obtient des nombres pseudo-aléatoires à distribution uniforme sur l'intervalle 
(0,1) en multipliant x; par 0,25. 


3. Calcul de x 


Il est très facile d'obtenir une valeur approchée de 7 en effectuant une simulation analogue à celle 
liée au problème de Buffon. Pour cela, il suffit de tirer deux nombres aléatoires indépendants à 
distribution rectangulaire sur (—1, +1) que l’on note £ et &. Dans le plan, le point aléatoire À 
de coordonnées £ et éz obéit à une distribution uniforme dans le carré de sommets (—1,1) et 
(1, —-1), elle vaut 0,25. Il est tout à fait simple de dénombrer les points À qui tombent dans le 
cercle de centre O et rayon unité. Si N est le nombre de tirages de couples £ et &, et si Q est 
le nombre de points À situés à l’intérieur du cercle unité, on voit que la probabilité de tomber 
dans le cercle est donnée par : 
_ surface du cercle č r Q 


— surface du carré 4 N 


Comme pour N donné on sait dénombrer Q, on obtient aisément une valeur approximative 
de r au moyen de la relation : 


-4 
TETN 


Il ne faut pas se méprendre sur la portée d’une telle méthode, seul son intérêt pédagogique est 
à prendre en considération car la précision relative varie en 1/ VN. On trouvera sur le Web (*) le 
programme calculpi.c qui effectue le calcul de x selon cet algorithme. Pour N = 1 000 000, on 
trouve m = 3,140 2, pour N = 100 000 000, on trouve m = 3,141 507, et pour N = 1 000 000 000, 
on trouve x = 3,141 6035. On vérifie bien que pour diminuer l'erreur d’un ordre de grandeur, il 
faut multiplier le nombre d'épreuves par 100... autrement dit, on vérifie bien sur cet exemple que 
la précision varie comme 1/ VN et que le générateur de nombres pseudo-aléatoires se comporte 
bien. 


4. Calcul d’une intégrale définie 


On désire calculer l'intégrale d’une fonction f(x) entre les bornes finies a et b. On suppose que 
f(x) est une fonction continue par morceaux. 


*http://www.edpsciences.com/guilpin/ 
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4.1. Première approche : simulation géométrique (intérêt strictement pédagogique) 


On note Xmax et X min les extremums de f(x) sur (a,b). On désigne par a et 8 deux nombres 
tels que à > Xmax et 8 < Xmin- 

On tire deux nombres aléatoires indépendants à distribution uniforme l’un sur l'intervalle 
(a,b), Pautre sur l'intervalle (œ, 8). On note £ et 7 ces deux nombres. Le point figuratif À de 
coordonnées (£, n) est uniformément réparti dans le rectangle de sommets (a, a) et (b, 8). N est 
le nombre de tirages de couples £ et n, et Q est le nombre de points À situés entre le graphe 
de f(x) et l’axe des x. Attention, il s’agit d'effectuer la somme algébrique des aires, et si 7 est 
négatif et qu’il figure entre le graphe de f(x) et l’axe des x, il convient ôter une unité à Q. Si 
l’on ne réalise pas cette opération, on effectue le calcul de l’intégrale de |f(x)|. Si 8 est positif 
aucun problème ne se pose. 


Remarque : Pour tirer des nombres pseudo-aléatoires entre a et b, on part d’un nombre € 
compris entre 0 et 1. Ensuite, on effectue la transformation : 


n=a+(b- ajé. 
Si l’on part d’un nombre £ compris entre —1 et 1, on effectue la transformation : 


n=a+(b-a)(£ +1)/2,0. 


On voit que la probabilité de tomber dans la surface algébrique de la fonction f(x) est donnée 
par : 


b 
aire algébrique J f(x) dx 


P= surface du rectangle  (b— a)(B — a) 


2, 
N 
On aboutit en définitive à lexpression : 


b 
fto) dz & £ (b - a)(8- a), 


„qui constitue une approximation de l'intégrale. 


4.2. Deuxième approche 


La méthode que nous venons de présenter est très sommaire. À présent nous allons présenter 
un autre estimateur de l’intégrale qui exploite des connaissances plus fines. Soit £ une variable 
aléatoire distribuée uniformément sur (a, b). Nous effectuons N tirages que nous notons é; avec 
i=1,..., N. Si N est un nombre grand devant l'unité, la grandeur : 


1 N 
h= 7 2.16) 


est un estimateur de la moyenne de la fonction f(x) sur l'intervalle (a,b), ce qui a pour 
conséquence que l’intégrale est estimée par la quantité (b — a) fo. On peut donc écrire : 


b N 
[roa Ere 


a i=1 
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cette technique est beaucoup plus efficace que la précédente dans la mesure où elle fait appel à 
beaucoup moins d'opérations. 

Sur le Web (ME on trouvera le programme intmonte.c qui réalise ces divers calculs sur des 
exemples simples. 


5. Intégration de l'équation de Laplace en un point 


On souhaite intégrer dans le domaine D l'équation de Laplace : 
8V A 8V à 8V B 
0x2 Of 92 


dans un repère cartésien orthonormé tridimensionnel dans le cadre des conditions de Dirichlet 
(on connaît V sur la frontière de D). Comme nous l'avons déjà fait au cours du chapitre 14, 
on superpose au domaine D un maillage cubique dont les nœuds des mailles sont notés par les 
triplets (i, j, k). Une méthode de Monte-Carlo pour calculer le potentiel V au point particulier 
(I, J, K) consiste à décrire une suite de N chemins tous issus du point (7, J, K} chacun de ces 
chemins se terminant tôt ou tard sur la frontière du domaine. Dès lors que l’on a atteint un 
point de la frontière, on note le potentiel V; de ce point et l’on recommence un nouveau chemin 
issu de (Z, J, K). Il est possible de montrer que le potentiel en (I, J, K) est la moyenne des V;, 
soit encore : 


0 


VOIR) = È YV: 


À présent, il reste à déterminer la façon dont on décrit un chemin dans le maillage. On doit 
pouvoir atteindre chacun des plus proches voisins d’un point donné quelconque hors la frontière. 
Avec le maillage que nous avons retenu il existe six plus proches voisins. Pour réaliser un chemin, 
il suffit de procéder à un tirage au sort de six nombres indépendants 1, 2, 3, 4, 5 et 6 qui sont 
équirépartis, et à chaque nombre on affecte arbitrairement un déplacement dans une des six 
directions. Par exemple, on peut convenir que : 


déplacement vers la gauche, 
déplacement vers la droite, 
déplacement vers le bas, 
déplacement vers le haut, 


déplacement vers lavant, 


D Où À © ND 


déplacement vers l'arrière. 


Il est aisé de fabriquer ces nombres pseudo-aléatoires. Soit £ un nombre pseudo-aléatoire 
obtenu par l'algorithme de Lehmer-Greenberger. Il est compris entre 0 et 1. Si on le multiplie 
par 6, il appartiendra à une répartition uniforme entre 0 et 6, 6 étant exclu. Il suffira donc d’en 
prendre la partie entière et d’y ajouter 1 pour obtenir la suite des points du chemin. 


n = entier {6€} +1. 
Nécessairement au bout d’un nombre fini d'opérations, on parviendra à la limite du domaine. 


*http://www.edpsciences.com/guilpin/ 
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6. Inversion d’une matrice carrée d'ordre n 


À y regarder de près, la résolution de l'équation de Laplace par les techniques du maillage est 
équivalente à la résolution d’un système linéaire. En effet, il suffit d’écrire la loi des mailles sur 
un ensemble convenablement choisi de points pour obtenir un système linéaire de n équations à 
n inconnues, n étant le nombre de nœuds du maillage. Puisque l’on sait résoudre l'équation de 
Laplace par une méthode de Monte-Carlo, on est en droit de penser qu’il est possible d’inverser 
une matrice également par une méthode de Monte-Carlo. 

Nous allons simplement donner la technique de résolution dans un cas particulier de matrices 
A d'ordre n qui sont telles que les éléments de la matrice B = I — A (où I est la matrice unité) 
obéissent aux inégalités suivantes : 


bij >0 et X by < 1, 
j=1 


c'est-à-dire que les b;; peuvent être interprétés comme des probabilités. 

Sans entrer dans le détail, nous allons voir qu’il y a moyen de décrire des chemins (selon un 
processus markovien) dans les lignes et les colonnes de la matrice B qui nous permet de calculer 
successivement les lignes de A7. Pour cela nous allons modifier toutes les lignes en remplaçant 
chaque élément par la somme des précédents sur chacune des lignes, soit pour la ligne j : 


bjo bjo + by bo + bi + bj2 DES bjo + b;1 + b;2 +... + bjn- 


Dorénavant, on désignera par ık ces nouveaux éléments. À présent on peut décrire le processus 
qui va conduire à l’inversion de la matrice. 


a. Souhaitant trouver l'inverse de la ligne j de À, on commence par tirer un nombre aléatoire £o 
à distribution rectangulaire sur (0,1). De deux choses l’une : ou bien ce nombre est inférieur 
ou égal à l'élément jn ou bien il lui est supérieur. 

b. S'il lui est supérieur on ajoute une unité au compteur de la ligne 7. 

c. S'il lui est inférieur ou égal on cherche la première colonne où l’élément lui est strictement 
supérieur ou égal, soit m cette colonne. 

d. On tire un autre nombre aléatoire é; indépendant du premier, et l’on opère avec la ligne m 
de la même façon que précédemment. On répète ces opérations jusqu’à ce que l’on trouve un 
nombre ¿p correspondant à la ligne r tel que p > Brn auquel cas on ajoutera 1 au compteur 
de la ligne r. 


On effectue les opérations de (a) à (d) N fois. Désignons par p, les compteurs de lignes 
correspondant donc à l’inversion de la ligne j. Il est possible de montrer que l’on a : 


z l Pk 
AU RS. 
be N1- brn 


Pour terminer, on traite toutes les lignes selon cette procédure ce qui nous fournit l’inverse 
(approchée) de la matrice A. 

Dans le cas général, la matrice À ne se présente pas sous la forme indiquée. Alors on choisit 
des coefficients +;; tels que : 


n 
bij = YijTij avec Tij >0 et X ry <ih: 
j=1 
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On trouvera dans l’ouvrage de Yu.A. Shreider cité en bibliographie le développement de cette 
technique. 

Sur le Web (=) le programme matmonte .c réalise l'inversion des matrices du type À particulier 
selon la technique développée dans ce paragraphe. 


7. Méthode du recuit simulé : recherche du minimum absolu 
d'une fonction 


On recherche le minimum minimorum d’une fonction f(x,y,z, ...) dans un certain domaine D. 
Pour des raisons de commodité d'écriture, on représente par X; le vecteur de composantes x;, 
Yis Zis 

L’algorithme se présente sous la forme suivante : 


a. On tire un premier vecteur (initial) aléatoire Xo au moyen du générateur de Lehmer- 
Greenberger tel que Xo € D. 
b. On tire un vecteur X; par le même procédé puis on calcule la probabilité de transition : 


p=exp(-@AF) avec AF = f(X) - f(X; 1). 


Si p > Seuil}, on conserve le dernier état, et l’on poursuit les opérations N fois (boucle sur 
b). 

c. Ensuite, on augmente 8 qui suit une loi du genre : Bn = Bn-1b0 et l’on effectue N calculs 
identiques à b. 


d. L'arrêt des calculs s'effectue lorsque 


of 

——| < Seuilz. 
A $ 
Cette procédure appelle quelques remarques : 


Remarque 1 : Au départ, il faut choisir Bo «petit ». 


Remarque 2 : Pour passer de X; à X;41, on a intérêt à ne changer d’état que sur une seule 
composante à la fois. On opère alors successivement sur les variables dans l’ordre z, y, z,... 


Remarque 3: N et Po dépendent, pour ce qui concerne leur choix, des erreurs propagées dans 
les calculs, aussi bien lors de la génération des nombres pseudo-aléatoires que dans le calcul de 
Af et F(X). 

Remarque 4 : Il faut veiller à ne pas « descendre trop vite », sinon, nous risquons de rester 
dans un minimum local dont on ne peut plus sortir (p < Seuil;). Toutefois, une «descente trop 
lente » est source d’instabilité. Il convient de choisir un compromis pour choisir 6o et N selon 
la fonction à minimiser. 


On trouvera sur le Web (*) le programme recuit.c qui réalise cet algorithme sur une fonction 
présentant un minimum absolu. Ici, il s’agit de la résolution d’un système de deux équations non 
linéaires à deux inconnues f(x, y) = 0 et g(x,y) = 0. Notons qu’il revient au même de minimiser 
une forme quadratique : 


F(x,y) = f(x, y) + g°(x, y). 


*http://wuw.edpsciences.com/guilpin/ 
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8. Simulation d'autres lois de distribution 


Il est assez simple d’obtenir d’autres lois de distribution à partir de la distribution uniforme. 
Supposons que la variable aléatoire £ admette la loi de répartition F(x). La variable n = F(£) est 
uniformément répartie, donc pour obtenir £ il suffit d’inverser la relation précédente à condition 
toutefois que cela soit possible. Si tel est le cas, on écrit : 


E= FT (n). 


8.1. Distribution sinusoïdale 


Par exemple, on peut générer une suite de nombres pseudo-aléatoires à distribution sinusoïdale 
en utilisant la relation : 


Ë = arcsin(n), 


E est évidemment entre —1 et +1. 


8.2. Distribution exponentielle 


De la même façon, on peut générer des nombres pseudo-aléatoires à distribution exponentielle 
qui peuvent alors permettre la simulation du comportement des neutrons dans une réaction 
nucléaire (distance entre deux chocs successifs). La loi de répartition est : 


F(x)=1-—exp(—-X?x) pour x > 0 
F(x) =0 pour z < 0. 


D'après ce qui précède, on écrit alors : log, (1 — £) = —)?" soit encore : 


1 
n= BU log. (1 za £). 


Si l’on remarque que la distribution de 1 — £ est la même que celle de £ puisque Ẹ appartient à 
(0,1), alors l'expression se réduit à : 


1 
T= — 33 lose (6) £ appartenant à (0,1). 


Il est donc très facile d'obtenir des nombres pseudo-aléatoires à distribution exponentielle. 


8.3. Distribution normale 


Eu égard à l’importance de cette distribution, nous allons étudier diverses techniques permettant 
de la générer. 


Somme de n nombres à répartition uniforme sur (—0,5,0,5) : n = >}; & - Pour obtenir la 
distribution de n, nous utilisons la notion de fonction caractéristique (voir le chapitre 21 consacré 
à cet effet). Soit (t) la fonction caractéristique de chaque é;, elle s’écrit : 

0,5 


(t) = foxi 2rjtx) d 


—0,5 


_ sin(rt) 


rt 
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La fonction caractéristique de 7 est donc &(t}", elle s’écrit : 


sin(rt) y 


nmt 


so = ao" = { 


en passant aux logarithmes, on obtient : 


log,[f(0)] = log, [ED 


nt 


sin(x) 


comme est une fonction qui tend vers zéro quand x croit indéfiniment, expression 


z 
précédente se comporte comme : 


242 242 
log[f(t)] ~ nlog h p ze] „ten 


de là on tire : 


2mm 


t2 
f(t) = Aexp (5) avec a? = 2 


La transformation inverse donne la fonction densité de probabilité, à savoir : 
2 
gl) = Bexp (-r2?a?) = Bep ( -F ), 


soit encore : 


En définitive, on obtient : 


(x) | ex 3 avec 0? = L 
= Vi = — » 
PO A AAN Der 12 


On voit aisément que si lon effectue la somme de 12 nombres aléatoires on obtient la loi 
normale réduite. Soit 79 un nombre aléatoire généré par ce procédé donc obéissant à la loi 
normale réduite. Il est aisé de voir que le nombre € = 00 + m obéit à la loi de distribution : 


g(x) = EP Er] 


par conséquent, il est facile de générer des nombres à distribution gaussienne avec une moyenne 
et un écart type choisis à l’avance. 

Si les nombres pseudo-aléatoires £ appartiennent à l'intervalle (0,1), il suffit d'effectuer le 
changement 7 = £ — 0,5 pour se ramener au problème précédent. 

Au cas où les queues de distribution de la gaussienne jouent un rôle prépondérant dans la 
simulation, on doit adopter un autre procédé pour générer notre suite de nombres gaussiens. 
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8.4. Distribution gaussienne à queues soignées 


On part de l’idée suivante : soient deux nombres aléatoires indépendants 7: et 72 obéissant 
chacun à la loi normale réduite, La somme des carrés de ces variables, soit Ç = n? + m2, n’est 
rien d'autre que la variable x? à deux degrés de liberté (chapitre 22) dont la loi de distribution 
s'écrit : 
x 

P(¢ < x) = 1 — exp (-) 
c’est la loi exponentielle de coefficient A? = 0,5 dont nous venons de simuler la répartition (voir 
aussi la loi du x2,). 

Par ailleurs, m1 et ņ peuvent être considérés comme les coordonnées, dans le plan, d’un 
point M d'argument 9 = (Oxz, OM). Cet argument ® suit une loi uniforme indépendante de la 
longueur de OM. 

Nous allons exploiter ces deux remarques pour calculer les nombres indépendants m et nz 
à partir des deux nombres indépendants distribués uniformément é; et é2. En se référant aux 
propos de l’alinéa b du paragraphe 8.2 (concernant la distribution exponentielle), il suffit alors 
de poser : 


n + m = —2log, (ĉ1) avec £1 appartenant à (0,1) 


= tan(d) = tan(2ré>) soit encore : n? cos?(2ré2) = nå sin? (27€), 
2 


avec £ appartenant à (0,1), d’où l’on tire : 


m = y —-2log, (é1) sin(2ré2) 
m = y —2 log, (£1) cos(2ré2). 


Il suffit de tirer deux nombres aléatoires à distribution rectangulaire € et & sur l'intervalle 
(0,1) indépendants pour obtenir deux nombres aléatoires à distribution gaussienne ņı et n2 
indépendants (distribution normale réduite). 
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19 | Éléments de calcul 
des probabilités 


Même au niveau très élémentaire, le calcul des probabilités est toujours truffé de pièges et de 
colles qui font que cette discipline est souvent redoutée. La lecture de l’ouvrage de J. Bertrand 
(1822-1900) cité en bibliographie est fortement recommandée tant elle est agréable. Il s’agit du 
fac-similé de la seconde édition française de 1907. C’est un ouvrage de référence, particulièrement 
connu à l'étranger, connu aussi pour sa rigueur épistémologique. Il est d’une lecture très aisée 
et ne nécessite en mathématiques que les connaissances correspondant au niveau du DEUG 
première année. 


1. Introduction et notions fondamentales 


Nous nous proposons d'examiner de quelle manière on peut étudier les phénomènes présentant 
un certain caractère dû au hasard (mot d’origine arabe ayant trait au jeu de dé). Une façon 
classique de présenter les problèmes consiste à examiner les fluctuations d’une grandeur autour 
d’une moyenne, en voici des exemples : la masse d’un corps au moyen de n mesures, la recette 
journalière d’un parcmètre, la trajectoire d’un navire entre deux ports, la trajectoire d’un avion 
entre deux aéroports. 

Dans notre présentation, il n’est pas utile de rechercher une définition très subtile du hasard, 
et il nous suffira de dire qu’il s’agit d’une causalité fictive, laquelle pourra évoluer en fonction des 
connaissances supplémentaires que nous acquerrons sur le système étudié (cf. les probabilités 
conditionnelles, les ensembles canoniques en mécanique statistique). 

Il faut bien insister sur le fait que l’étude des phénomènes aléatoires (mot latin ayant trait 
au jeu de dé) ne présuppose pas l’abandon du déterminisme. Certains problèmes, examinés 
sous l'angle de la physique traditionnelle, exigent une modélisation très complexe qui, dans 
les meilleurs des cas, peut conduire à un ensemble d'équations. Ces équations ne sont jamais 
justiciables d’un traitement analytique et seul l’aspect calcul numérique pourrait être envisagé ; 
on doit se rendre à l'évidence : le temps de calcul est prohibitif, l’espace mémoire démentiel... 
bref, le problème est bel et bien irréaliste. C’est ainsi que l’on préfère envisager l’usage d’un 
autre procédé d’analyse qui sera sans doute beaucoup moins fin mais qui fournira les résultats 
globaux que nous attendons. Pour se convaincre de cette réalité, il suffit de considérer le simple 
jeu de pile ou face. 

Si l’on fait abstraction de l’hypothèse selon laquelle la pièce pourrait rester en équilibre sur 
la tranche, ce qui nous intéresse c’est savoir quelle est la face présentée par la pièce à la fin de 
l’expérience. À priori, cette face peut être déterminée à partir du moment où l’on connaît la 
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position initiale de la pièce, sa forme, sa densité, les forces mises en jeu pour la lancer, plus un 
certain nombre de renseignements liés à l’atmosphère dans laquelle elle se déplace, c’est-à-dire la 
densité de l’air, la résistance de Fair, etc. et d’autres renseignements liés à la surface sur laquelle 
est censée s’immobiliser la pièce par exemple nature du matériau, rugosité etc. Ainsi, le problème 
présente toutes les qualités pour être modélisé selon les règles classiques et donc de constituer un 
problème déterministe ordinaire. Point besoin d’être un grand clerc pour se rendre compte que 
cette conception conduit inexorablement à une impasse, car le problème ainsi envisagé devient 
immédiatement inextricable. Par conséquent, force est d'abandonner cette méthode et d’utiliser 
les voies offertes par la théorie des probabilités. Peu importe la façon dont la pièce est parvenue 
sur l’une des faces, seul le résultat nous intéresse, et cela constitue un événement. Dans le cas 
présent, deux événements sont possibles : la pièce peut présenter face ou pile. 

À l'événement, est associée la probabilité de cet événement. Sans entrer dans les querelles 
de définition, on peut dire que la probabilité est la mesure numérique de la possibilité de la 
réalisation effective de l’événement. Cette notion va s’éclairer dans les paragraphes suivants. 

Le problème essentiel de la théorie des probabilités repose sur la mesure effective de la 
probabilité, et il y a essentiellement deux façons de traiter le problème : 


a. on est en mesure d'effectuer a priori une évaluation directe des probabilités (calcul direct) ; 
b. on effectue une mesure de la probabilité au moyen d’expériences sur une population, on 
parlera alors de probabilité empirique d’un événement (ou probabilité statistique). 


2. Évaluation de la probabilité 


2.1. Calcul direct des probabilités 


C'est le cas que l’on rencontre lors de l’étude de systèmes qui peuvent être décrits a priori et 
qui possèdent les propriétés suivantes : 


1. Un événement et un seul se manifeste à la fois. Il s’agit par exemple du tirage d’une carte 
dans un jeu de trente-deux cartes. 

2. Les événements sont incompatibles entre eux : ils ne peuvent pas apparaître ensemble. Cela 
signifie qu’un as de cœur ne peut pas être un roi de pique. 

3. Les événements sont équiprobables a priori, ou encore les probabilités de chaque événement 
sont a priori égales. Cela veut dire que, pour des raisons de symétrie, aucun des événements 
ne se manifeste plus que les autres; il n’y a aucune raison pour que les événements aient des 
poids différents. 


Lorsque la propriété 1 est vérifiée, on dit que le système est complet, lorsque les trois propriétés 
sont vérifiées, on dit que le système est exhaustif. 

L'intérêt de définir un système exhaustif repose sur la possibilité d'étudier tous les problèmes 
classiques de jeu de hasard où l’équiprobabilité des événements est assurée d’avance. 

Par définition, on dit qu’un cas est favorable si son apparition entraîne la réalisation de 
l’événement en question. Il s’ensuit que la probabilité de l'événement À que nous notons P(A) 
est alors le rapport du nombre de cas favorables m et du nombre de cas possibles n, soit : 


m 
P(A)=. (19.1) 
n 
On voit apparaître la propriété «évidente » que P(A) est un nombre compris entre 0 et 1. 
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2.2. Probabilité empirique d’un événement ou mesure de la fréquence relative 


Plus simplement il s’agit d'envisager l’étude des cas où la propriété de symétrie a disparu ; c’est 
le cas, par exemple, du dé pipé. C’est l’expérience qui révèle l’absence de symétrie, ou plutôt 
une série de n expériences. On appelle fréquence de À le nombre d’expériences où l'événement 
À est apparu divisé par le nombre total d'expériences effectuées. On réalise ainsi une mesure 
expérimentale de la probabilité, et l’on parle dans ce cas de probabilité empirique ou statistique. 

À présent apparaît un sérieux problème : la probabilité statistique change d’une série 
d'expériences à l’autre. Cette difficulté se trouve réglée par l'intermédiaire du théorème de 
Bernoulli : 

Soit un nombre 7 > 0 aussi petit que l’on veut, la probabilité pour que la différence entre 
la fréquence d’apparition de l'événement et la probabilité de cet événement soit inférieure à n, 
tend vers un lorsque le nombre n des épreuves augmente indéfiniment. 

Ce théorème que nous démontrerons plus loin est l’expression de ce qui est appelé la loi des 
grands nombres. 

À l’occasion de l'énoncé du théorème de Bernoulli, nous venons d'introduire une notion 
nouvelle de la convergence : la convergence en probabilité : 

On dit que X, tend vers Xo en probabilité si, quel que soit € > 0 aussi petit que l’on veut, la 
probabilité de vérifier l'inégalité 


Xn — Xol <E 


tend vers 1 quand n tend vers linfini. 
Notons qu’un écart important peu exister mais il est peu probable, et d’autant plus improbable 
que n le nombre d'épreuves est grand. 


3. Notion de variable aléatoire 


Par définition, toute variable dont la valeur est fixée par la réalisation d’une épreuve appartenant 
à une catégorie déterminée est appelée variable aléatoire. 

Il ne faut pas confondre la variable aléatoire avec les valeurs effectives que cette variable est 
susceptible de prendre. 

Par exemple, la variable aléatoire X désigne le nombre présenté par la face d’un dé nor- 
malement numéroté. Ainsi, les valeurs possibles de la variable aléatoire X sont 1, 2, 3, 4, 5 
et 6. 

Nous venons de définir une variable aléatoire X qui est discrète. Il est tout à fait possible 
de définir une variable aléatoire continue en disant qu’elle peut prendre toutes les valeurs à 
l’intérieur d’un intervalle D fini ou infini. Par exemple, il suffit de penser à la longueur de la 
trajectoire suivie par un avion entre Paris et New-York : toutes les valeurs sont possibles à 
l’intérieur du domaine D. 


4. Somme et produit d'événements. Théorèmes fondamentaux 


Ces notions et théorèmes vont nous permettre de réduire une expérience relativement complexe 
en sommes et produits d'événements à partir desquels il sera aisé d'effectuer des calculs. Il s’agit 
de mettre en œuvre une méthode indirecte qui peut s’appliquer à tout un ensemble de problèmes 
que la probabilité soit connue directement ou empiriquement, que les variables aléatoires soient 
discrètes ou continues. 
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4.1. Définitions 


a. La somme de deux événements À et B notée (A+ B) est un événement C tel que l’événement 
À se réalise, ou bien l'événement B ou encore les événements À et B. 
Il s’agit du OU inclusif. Par exemple, le tirage d’un as en deux coups dans un jeu de trente- 
deux cartes : on peut tirer un as le premier coup, ou bien un as le second coup, ou encore 
tirer un as le premier coup et un as le second coup. 

b. Le produit de deux événements À et B noté (A: B) est un événement C consistant en la 
réalisation simultanée des événements À et B. 
Il s’agit du ET. Par exemple, le tirage de deux boules blanches dans une urne contenant 
nı boules blanches et n2 boules noires (avec nı > 2 et n 0), en effectuant deux tirages 
consécutifs en remettant la première boule tirée dans l’urne. (Rien n’est changé si on ne remet 
pas la boule dans Purne.) 


4.2. Exemples d'application 


Nous allons utiliser ces deux notions pour décomposer en « éléments simples » quelques 
problèmes de probabilité relativement complexes. 

On considère le problème suivant : on joue trois fois de suite au jeu de pile ou face et l’on note 
le résultat P ou F selon que l’on a obtenu pile ou face. On numérote les résultats en donnant 
un indice à P et F. On peut tout de suite remarquer que, dans ce jeu, l'événement contraire à 
P que l’on note P est F, et cela peut aider l’écriture des événements. 


a — Problème n° 1 — Sur les trois lancements de la pièce, on désire obtenir exactement une 
seule fois pile. 
L'événement qui nous intéresse est l'événement E ainsi défini : 


E = P, - P,- P + Pi- Po- P+ PP P. 


b — Problème n° 2 — Sur les trois lancements de la pièce, on désire obtenir au moins deux 
fois pile. 
L'événement se note : 


E = P, Po P+ Pi- Po: P + Pi: Po: P3+ Pi: P P. 


À partir de cette décomposition, il sera facile de calculer les probabilités correspondant à 
la réalisation des événements étudiés dans la mesure où, toutefois, nous savons calculer les 
probabilités correspondant à la somme et au produit de deux événements. Avant d'aborder cet 
aspect du problème, il convient de rappeler deux définitions : 


c — Evénements incompatibles — Ils ne peuvent se réaliser simultanément, par exemple, si 
l’on tire une carte dans un jeu traditionnel, cette carte ne peut être à la fois un cœur et un pique, 
en revanche, l'extraction et d’un carreau et d’un roi constitue deux événements compatibles. 


d — Événements indépendants — La réalisation de A ne dépend pas de la réalisation de B ou 


de sa non-réalisation. On dit que deux événements sont indépendants si la réalisation de l’un ne 
change pas la probabilité de réalisation de l’autre. 
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4.3. Théorème des probabilités totales 


La probabilité de réaliser l'événement E constitué par la somme des événements incompatibles 
A et B est égale à la somme des probabilités de ces événements ; on notera : 


P(E) = P(A + B) = P(A) + P(B); 
s’ensuivent deux corollaires pratiquement évidents : 


a — Corollaire 1 — Si les événements A1, 4,..., An forment un système complet d'événements 
incompatibles, la somme de leurs probabilités est égale à l’unité, soit : 


5 P(A;) = 1. 


b — Corollaire 2 — La somme des probabilités d’un événement et de son contraire est égale à 
un. 


4.4. Théorème des probabilités composées 


La probabilité du produit Æ de deux événements est égale au produit de la probabilité de l’un 
d’eux et de la probabilité conditionnelle du second, calculée sous la condition que le premier ait 
lieu : 


P(E) = P(A:B)= P(A) - P(BJA). 


Commentons cette proposition. Rappelons que deux événements sont indépendants, si la 
probabilité de A ne dépend pas de la réalisation de B, sinon, ils sont dépendants. Prenons un 
exemple : une urne contient deux boules blanches et une boule noire. On considère les événements 
suivants : 

L'événement À : la première boule tirée est blanche. 

L'événement B : la deuxième boule tirée est blanche. 

On réalise l'expérience suivante : on tire une première boule que l’on place dans la boîte n° 1 
sans en prendre connaissance, puis on tire la seconde boule que l’on place dans la boîte n° 2 sans 
en prendre connaissance. À présent, on peut prendre éventuellement connaissance de la boule 
contenue dans la boîte n° 2, en ignorant le contenu de la boîte n° 1. 

La probabilité de tirer une boule blanche, dans le cas de l'événement À, ne connaissant pas 
l'événement B, est P(A) = 2/3. En revanche, si l’on sait que l'événement B s’est réalisé, alors 
la probabilité est P(A) = 1/2. 

On appelle probabilité conditionnelle de A relative à B, et l’on note P(A/B) la probabilité 
de A calculée sachant que B s’est réalisé. On rencontre aussi d’autres façons d'écrire : P(A|B) 
et P(A si B). La notation devient alors : 


P(A)=2/3 et  P(A/B)=1/2. 


Dans le cas où À est indépendant de B, on a : P(A/B) = P(A) Il s'ensuit les corollaires 
suivants : 


a — Théorème - La probabilité de deux événements indépendants est égale au produit des 
probabilités de ces deux événements. 


b — Théorème -— Si À est indépendant de B, alors B est indépendant de À. 
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4.5. Formule des probabilités totales 


Il s’agit de calculer la probabilité d’un événement À pouvant avoir lieu simultanément avec l’un 
des événements Hı, H2,..., Hn lesquels forment un système complet d'événements incompa- 
tibles, on obtient : 


P(A) = 7 PHP (AH). 


4.6. Formule de Bayes (1702-1761) (théorème des causes ou des antécédents) 


Envisageons à présent que l’événement À se produise obligatoirement avec l’un des événements 
Hı, Ho,..., Hn qui sont antérieurs à l’événement À et qui constituent un système complet 
d'événements incompatibles. L’ensemble des événements {Hp} peut être considéré comme la 
«cause » de À. Le mot cause tient à la formulation historique et non à sa nature philosophique, 
et J. Bertrand dit à ce sujet : «Les causes sont pour nous des accidents qui ont accompagné ou 
précédé un événement observé ». C’est pourquoi, il serait plus raisonnable de parler d’antécédent 
que de cause, cependant, par respect de la tradition nous utilisons le mot cause. 

Le problème que l’on pose alors est le suivant : sachant que À s’est produit, quelle est 
la probabilité pour que ce soit précisément la cause H; qui l’ait produit? On suppose que 
l’on connaît les probabilités d'intervention de chaque cause H4. À priori ces probabilités sont 
connues, et on cherche a posteriori la probabilité sachant que l’événement À s’est effectivement 
réalisé. 

Donnons un exemple d’après J. Bertrand. Un joueur prend le pari d'amener avec deux dés un 
point supérieur à 10. L'événement À est : il a gagné. Ceci peut être réalisé en amenant le 11 et 
le 12 : telles sont les causes de succès. 

Avant l'expérience, les probabilités des causes sont P(H:), P(H2),..., P(Hn). Comment ces 
probabilités se trouvent-elles modifiées par la réalisation de l'événement A? Il nous faut donc 
trouver P(H;,/A) pour chaque cause. 

La démonstration est simple, nous pouvons écrire : 


P(H% : A) = P(A- Hp) = P(A)P(H4/A) = P(H:)P(A/H4) pour k=1,2,...,n, 
soit encore en tenant compte de la dernière égalité : 
P(Hx)P(A/Hx) 
P(A) ? 
enfin, en utilisant la formule des probabilités totales, on obtient : 


P(Hz)P(A/H%) 


P(Ax/A) = 


P(Hk/A) = 


Nne 


5 P(H;)P(A/H;) 


i=1 
Exemple — Deux étudiants passent l'examen de MPA. Le premier a la probabilité pı = 0,7 
d'obtenir l'examen, le second la probabilité p = 0,6. Un étudiant a été reçu. Trouver la 
probabilité que ce soit le premier. 
À priori, on retient les causes (antécédents) suivantes : 

Hı: aucun étudiant n’est reçu; 

H>: les deux étudiants sont reçus; 

H;: seul le premier étudiant est reçu; 


H,: seul le second étudiant est reçu. 
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Il n’y a pas de difficulté à calculer les probabilités attachées à ces causes : 


P(Hi) = (1 — p1)(1 — p2) = 0,3 x 0,4 = 0,12 
P(H2) = pipz = 0,7 x 0,6 = 0,42 

P(H3) = p1(1 — p2) = 0,7 x 0,4 = 0,28 
P(H:) = (1 — pı)p2 = 0,3 x 0,6 = 0,18 


Remarque : On vérifie bien que la somme des probabilités est égale à 1. 


Les probabilités conditionnelles de l’événement observé À (un étudiant est reçu) liées aux 
causes Hp s'écrivent : 


P(A/Hi) = 0,0 
P(A/H:) = 0,0 
P(A/H3) = 1,0 
P(A/Ha) = 1,0 


Une fois l'événement A réalisé, les deux premières causes deviennent impossibles, et les 
probabilités des causes deviennent : 


P(A/ H; 0,28 


P(H3/4) = ai 


3) ) a , 2 

PURPA H) + PUHAPA/H) 0284018 0h 
P(H,)P(A/Ha) o 0B 

PATE P(H3)P(A/H3)+ P(Ha)P(A/H4) 0,28 +0,18 Y 


Il faut bien comprendre ce que signifient ces calculs, et ils peuvent être obtenus par une autre 
voie. Seules les deux hypothèses H, et H4 sont compatibles avec la réalisation de l'événement 
A, P(H;) + P(H3) west plus égal à 1 puisqu'on tient un renseignement de plus : l'événement 
À s’est réalisé. Les probabilités conditionnelles restent proportionnelles entre elles, il suffit donc 
de calculer à tel que a[P(H3) + P(H4)] = 1, donc : 


1 
P(B3) + P(H4)' 


Q = 


puis P(H3/A) =aP(H3) et P(H,/A) = aP(Ha). 


5. Lois de répartition des variables aléatoires 


La description complète d’une variable aléatoire, qu’elle soit discrète ou continue, impose la 
connaissance de l’ensemble des valeurs susceptibles d’être prises par la variable aléatoire mais 
aussi du poids attaché à chacune des valeurs (ou probabilité). 

On se trouve alors dans le cadre d’un système complet d'événements incompatibles. 
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5.1. Cas de la variable discrète 


La somme des probabilités attachées à tous les événements est égal à 1. La variable aléatoire 
discrète X prend ses valeurs sur l’ensemble fini ou infini (x1,%2,%3,...,%n) — n fini ou non — 
chaque valeur zę ayant la probabilité pọ de se réaliser. On a alors : 


La connaissance de la loi entre le poids attaché à chacune des valeurs possibles de la variable 
aléatoire et ces mêmes valeurs possibles constitue toute l’information nécessaire à la description 
de la variable aléatoire. Souvent, il est commode d'employer une autre description en utilisant 
la fonction de répartition ou répartition. | 


5.2. Définition 


La fonction de répartition est la probabilité de l'événement X < x. On note : 
P(X < x) = F(z). 


C’est une caractéristique universelle de la loi entre les {x4} et les {px} que les variables soient 
discrètes ou continues. Ses propriétés essentielles sont : 


a. F(x) est une fonction non décroissante de x. 
b. F(—œ) = 0. 
ce F(+oo) = 1. 


La répartition permet de connaître la probabilité pour qu’une variable aléatoire tombe dans 
un intervalle donné. 


5.3. Cas de la variable continue 


La répartition demeure une approche classique, mais on utilise aussi la densité de probabilité 
ou distribution, laquelle en première approximation est la dérivée de la fonction de répartition. 

La rigueur voudrait que la répartition soit introduite au moyen de l'intégrale de Stieltjes 
(1856-1894), mais cela n’est point nécessaire pour le propos qui nous préoccupe. Par conséquent 
le lien entre la répartition F(x) et la densité de probabilité f(y) est réalisé par l'intégrale de 
Riemann : 


F(x) = J f(u) dy. 


Dans les cas ordinaires, la connaissance de F{x) ou de f(y) suffit à caractériser la variable 
aléatoire étudiée. 


En pratique, on aime bien utiliser un certain nombre de grandeurs associées à la variable 
aléatoire telles que les caractéristiques de position et les moments. 
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5.4. Les caractéristiques de position 


a — La valeur moyenne — Encore appelée espérance mathématique d’une variable aléatoire. 
Elle est définie ainsi : 


n +00 
M(X) = Ÿ prt ou M(X)= Î ste) à 
k=1 — 00 


selon que la variable est discrète ou continue. Comme on le verra plus loin c’est aussi le moment 
non centré du premier ordre. 


b — Le mode — C’est la valeur la plus probable de la variable aléatoire, soit encore le maximum 
de la densité de probabilité dans le cas l’une répartition unimodale d’une variable aléatoire 
continue. 


c — La médiane — C’est la valeur me de la variable aléatoire telle que : 


P(X < me) = P(X > me) = 0,5. 


5.5. Les moments 


Par définition, on appelle moments non centrés d’ordre k l’espérance mathématique de la variable 
XF. On écrit alors : 


n to 
me(X) = M|X"] = X piz} ou  — Î af f(x) dz. 
i=1 EAN 


Il s’agit de moments tout à fait semblables à ceux de la mécanique, en assimilant p; à un 
poids ou f(x) à une densité massique (volumique, surfacique, linéique). 

Il est plus utile de définir les moments centrés d'ordre k de la variable aléatoire centrée X*. 
Par définition, la variable aléatoire centrée X* est la variable aléatoire X qui a subi un décalage 
d’origine égal à son espérance mathématique mı : 


X*=X- mi. 
Les moments centrés s’écrivent : 
n +00 
p = m(X) = MX = Spies) ou = f (e-m) fa) de 
i=1 me 


On vérifie sans peine que le moment centré d'ordre 1 est nul : pı = 0. Le moment centré 
d'ordre deux s’appelle variance D(X) = p2, c'est l'espérance mathématique du carré de la 
variable centrée. Cette grandeur est attachée à la mesure de la dispersion, et l’on appelle écart 
quadratique moyen ou écart type la quantité o(X) = y D(X). 

Le moment d'ordre 3, u3, caractérise l’asymétrie tandis que 4 caractérise l’aplatissement. 
Ces deux dernières grandeurs permettent de comparer une loi de distribution donnée à la loi 
normale (Gauss-Laplace). 
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6. L'inégalité de Bienaymé (1796-1878) - Tchebycheff 


On considère une variable aléatoire X de moyenne m et d'écart type ø. Par ailleurs, on se donne 
une valeur t > 0 arbitraire et l’on se propose de calculer la probabilité P que le module de la 
variable (X — m) soit supérieur à t fois la grandeur ø. On recherche donc P(|X — m| > to). 

Sur la droite Ox, on porte le point M d’abscisse m, le point À d’abscisse (m — to) et le point 
B d’abscisse (m + to). Sur Oy on porte la densité de probabilité (cf. Fig. 19.1). 


A M B 


O m-to m m + to T Figure 19.1. 


En d’autres termes, la probabilité cherchée est celle pour laquelle X n'appartient pas au 
segment AB. Écrivons D(X) = 0? : 


= D Piltin)? ou o° = J (x — m} f(z) dz. 


On peut encore écrire la décomposition suivante : 


PR Re 


XE(co,B) XE(A,B) XE(A,-00) 
B oo 

= f+f+f: 
A B 


co _=A+B+C d'où o?>A+C. 


ou encore 


Le, 


quelle que soit l’expression, on peut écrire : 


Par ailleurs, hors le segment AB : 
(zi - m} > to? 
et l’on peut écrire que : 
A+C >to Y pi 
avec 5> pi signifiant que la sommation porte sur les valeurs extérieures au segment AB. Mais 
c’est aussi la probabilité recherchée que l’on désigne par P. En définitive, on obtient : 
o? > Po? soit P< z . 
En conclusion, on voit que la probabilité d’un écart supérieur à to décroît comme 1/t?, et 


cela quelle que soit la loi de distribution. Cette inégalité de Bienaymé-Tchebycheff trouve une 
belle application dans la démonstration du théorème de Bernoulli. 


308 


19. ÉLÉMENTS DE CALCUL DES PROBABILITÉS 


7. Le théorème de Bernoulli 


On se propose donc d'étudier la convergence en probabilité de la moyenne empirique v/n vers 
la moyenne théorique p. On verra au chapitre 20 que des considérations sur la loi binomiale 
donnent les résultats suivants : 


E(=) =? et p(=)-® avec p+q=1l. 
n n n 


On utilise l'inégalité de Bienaymé-Tchebycheff en posant : 


n ti 
E4/— avec €>0 arbitraire. 


t= 
pq 
D'où 
P(|- >e)< À a 
— — TN — —— >» 
n =] 7 ne? T 4ne? 


Soit ô un nombre positif tel que n > MER n croissant autant que l’on veut, ô sera aussi petit 


que l’on veut, et l’on aura : 
P(|2-m| >e) < ô. 
n 


En définitive, la probabilité pour que la fréquence v/n diffère de sa valeur moyenne d’une 
quantité dont le module est au moins égal à £, tend vers zéro quand n tend vers linfini quel que 
soit € > 0. Il s’agit, rappelons-le, de la convergence en probabilité. 
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20 |La loi binomiale, 
| | la loi de Poisson 
et la loi de Gauss-Laplace 


Les fondements de la statistique reposent sur la connaissance fine de quelques lois de distribution 
dont la principale est la loi de Gauss-Laplace. Cette dernière découle directement de l'étude de la 
loi binomiale : elle en exprime alors le comportement asymptotique lorsque le nombre d'épreuves 
devient extrêmement grand (supérieur à 100 pour fixer les idées), autrement dit, on effectue un 
passage de la variable discrète à la variable continue. 

Dans le cas où la probabilité dans la loi binomiale est très petite devant l'unité, sans pour 
autant que le nombre d'épreuves soit très grand — le produit À de ces deux nombres est proche de 
Tunité — on débouche sur la loi de Poisson. Celle-ci admet naturellement la loi de Gauss-Laplace 
comme loi asymptotique dans le cas où le nombre d’épreuves devient très grand, À étant très 
nettement plus grand que l’unité. Cette loi est utilisée lors de l’étude des «événements rares » 
qui sont, par exemple, les phénomènes observés par les compagnies d’assurance (sinistres) ; elle 
entre aussi pour une part active dans l’étude des files d’attente et de la fiabilité. 


1. La loi binomiale, schéma de Bernoulli 


On effectue une série d'épreuves qui donnent lieu chacune à une éventualité parmi deux 
éventualités, chacune des éventualités ayant une probabilité constante. 

Par exemple, on considère une urne qui contient P boules blanches et Q boules noires. On 
tire une boule, on note sa couleur, puis on la remet dans l’urne et ainsi de suite. Nous avons 
alors effectué des tirages non exhaustifs dans une urne à deux catégories, on dit aussi tirages 
avec remise dans une urne à deux catégories, c’est ce qu’on désigne par schéma de Bernoulli. 

Choisissons comme éventualité favorable le tirage d’une boule blanche dont la probabilité est 
p. On réalise n épreuves consécutives. On note d’abord que les tirages sont indépendants les 
uns des autres. La probabilité pour que k d’entre eux soient favorables, donc (n — k) soient 
défavorables est donc : 


1. p#q""* si l’on spécifie l’ordre dans lequel les cas favorables et défavorables doivent se succéder ; 
2. Ckpkq"$ si l’ordre n’a pas d'importance. 


C'est cette seconde forme qui va faire l’objet de notre attention. Ainsi la probabilité est donnée 
par l’expression : 


n! 
Pie k „n-k 
e Me ke À * 
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c'est aussi le terme de rang k du développement du binôme de Newton : 
(p +g)” =q" tng tpt- + Ci pi + pt 


Calcul des moments 


On écrit le binôme sous la forme légèrement modifiée : 
S(t) = (q + pt)” D 


où (t) s'appelle la fonction génératrice des moments ; elle constitue un artifice commode pour 
effectuer le calcul des caractéristiques de position. Le moment d’ordre zéro s’écrit en fonction 
de ®(t) de la manière suivante : 


Si l’on dérive les deux membres donnant ®(t) par rapport à t, on obtient : 


®'(E) = np(q + pt)" DCE 1 


En faisant t = 1, on trouve : 


c'est-à-dire le moment d'ordre un. 
Les dérivations successives donnent des expressions fournissant tous les moments successifs 
après avoir fait t = 1. Seul le deuxième moment va retenir notre attention : 


n n n 
D(t) = n(n — 1p’ (q + pt)? = Y k(k — 1) Pet? = XO kPt? YO kPt? 
k=0 = = 


Faisons t = 1 : 


P" (1) = n(n — 1)p? = m — mu. 
De là on déduit : 
m = n(n — 1)p? + np = npq + n°p°. 
Or le moment centré d’ordre deux s'écrit : 
p2 = ma ~ MÌ = ny4, 


l'écart type a pour expression : o = ,/npq. 

Il s’agit là des deux résultats essentiels de la loi binomiale ; et comme on va le voir, seuls ces 
deux premiers moments figurent dans la loi de Gauss-Laplace. Avant d'entreprendre l’étude de 
cette loi, étudions la loi de Poisson qui, elle aussi, est une loi asymptotique de la loi binomiale 
avant d'admettre elle-même la loi de Gauss-Laplace pour asymptote. 
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2. Loi de Poisson 


Nous envisageons le cas où p (ou q) est très petit devant l’unité et où n est très grand sans 
toutefois l’être suffisamment pour que l’on retrouve directement la loi normale, le produit pn 
doit être de l’ordre de grandeur de l’unité. Reprenons l'expression de Pp : 


n! kp nn-1)(n-2)...(n—-k+1) 
P. = kzn k— k n 
e= mep HG p p°(1-— p)”, 
soit encore : 
np(np — p)(np — 2p)... — kp + 
pe AU com DC te p E 


k!(1 — p)! 


ou bien : 


= np(np — p)(np — 2p) . .. (np — kp + p) np\” 
PES kI- p) Ga 


Posons À = np, il vient : 


 A(A—p)(A —2p)...(À — kp +p) ANS 
a a 


Comme À = np est de l’ordre de l’unité, il est grand devant p qui lui-même est petit devant 
l'unité ; ainsi le numérateur du second membre tend vers ÀF et (1— p) tend vers un. Il s'ensuit 
que, puisque n est grand devant k, nous pouvons écrire : 


A AN 
r=% (1-2) 


Or (1 — à)" tend vers exp(—À) quand n tend vers l'infini (résultat classique d’analyse). D'où 
l'expression de la loi de Poisson : 


AKE 
Py= a exp(—à). 
La loi de Poisson donne la distribution d’une variable aléatoire discrète qui peut prendre les 
valeurs entières non négatives (0,1,2,...,n,...). 
On dit que la variable X est répartie selon la loi de Poisson si sa probabilité est donnée par 
l'expression de Pk, quel que soit le paramètre À. 


2.1. Propriétés essentielles de la loi de Poisson 


Ayant effectué un certain nombre d'opérations sur la loi binomiale, il est indispensable de vérifier 
que la loi de distribution proposée est bien normalisée, c’est-à-dire : 37% 9 Pr = 1. En effet : 


OO ee) k oo k 
5 P; = 5 X exp(—À) = exp(—À) y i = exp(—à) exp(+À) = 1. 
k=0 
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a — Moment du premier ordre 


OO CO k O0 DU 
mı = M(X)= SC KP = SR z7 eXP(—A) = exp(—À) 5y kar 
k=0 k=0 k=0 
Co Akl 
mı = Àexp(—À) D À 


La moyenne de la variable aléatoire X qui prend les valeurs entières non négatives et qui suit 
une loi de Poisson est égale au paramètre À. 


b — Moment du deuxième ordre 


X %2 kk- 
m2 = YEPP, = Xexp(—À) $. -1 k 
k=0 k=1 


Par le même procédé que celui que nous venons d’utiliser pour calculer le moment du premier 
ordre, après avoir posé K = k — 1, nous obtenons : 


K=0 K=0 K=0 


Les deux sommes dans la dernière expression ont été calculées, il suffit donc de reporter leurs 
valeurs : 


mz = Àexp(—X)(1 + À)exp(+À) = X? + À. 
Comme la variance D(X) = m — mê, on en déduit que : 
D(X}=0= À, 
Donc le moment centré du deuxième ordre est égal à la moyenne, tous deux étant égaux au 


paramètre À. 


Remarque 1 : On dit souvent que la loi de Poisson est la loi qui régit les événements rares, et 
l’on trouve une application importante dans l’étude des séries chronologiques, l’étude des files 
d'attente ainsi que l'étude de la fiabilité. 


Remarque 2 : Soit R; la probabilité pour que X > k, elle s’écrit simplement : 


oo k—1 
Rx = 2 ne. 
m= j= 


c — Processus de Poisson — On considère une suite d'événements {E;} qui se succèdent dans 
le temps. Durant un intervalle fini de temps 7, le nombre k d'événements est aléatoire, et l’on 
désigne par mą(T) la probabilité d'observer k événements pendant l'intervalle de temps r. 

La variable aléatoire discrète X attachée aux événements {E;} est construite de la façon 
suivante : 


a. À t=0, X =0. 
b. X augmente d’une unité lors de l’apparition d’un événement. 
c. X conserve sa valeur tant qu'aucun événement ne se manifeste. 
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On définit alors un processus de Poisson de la manière suivante : 


1. mk(T) ne dépend que de 7 et non de l’origine des temps To- 

2. Durant un intervalle de temps infiniment petit dr, la probabilité d’apparition d’un événement 
E est proportionnelle à dr, et l’on désigne par dr1(dr) = r dr cette probabilité. 

3. La probabilité de voir apparaître deux événements ou plus dans l'intervalle de temps 
infiniment petit dr est infiniment petite par rapport à dr. 

4. Si 74 et T2 sont des intervalles de temps sans intersection commune, alors les probabilités 
zk(ni) et mk(T2) sont indépendantes. 


Compte tenu de ces conditions, la probabilité de n’observer aucun événement durant le temps 
infiniment petit dr est : 


dro( dr) = 1 -r dr. 


À présent, on se propose de trouver la loi de distribution m£(r) de la variable aléatoire X, 
c’est-à-dire la probabilité d'obtenir exactement k événements durant l'intervalle de temps fini r. 

Découpons l'intervalle de temps T en n sous-intervalles égaux de telle sorte que AT = T soit 
de l’ordre de dr. 

La probabilité d'observer un événement dans chaque intervalle est donc rAr et la probabilité 
de n’en observer aucun est 1—rA7. Comme les événements sont indépendants dans les intervalles 
de temps disjoints de longueur AT, on peut considérer les n intervalles élémentaires comme n 
expériences indépendantes pour chacune desquelles un intervalle élémentaire a la probabilité rAr 
de voir apparaître effectivement un événement. La probabilité pour que k des n sous-intervalles 
aient vu se réaliser un événement est par conséquent donnée par la loi binomiale : 


noza (Ee 


On pose a = r7, on obtient alors : 


a k a n-k 
OE 
n n 
Il nous reste à étudier le comportement de m(T) quand n tend vers linfini. Pour cela, il suffit 


de reprendre le calcul déjà effectué lors de létablissement de la loi de Poisson, et avec la même 

technique, on trouve : 

afeT 
k! 


Donc, la variable aléatoire X suit une loi de Poisson de paramètre a. 


a 


Tk = 


Remarque : Au lieu de considérer le temps 7, il est possible de s'intéresser à une distribution 
de points sur la droite ou dans le plan qui obéiraient aux mêmes propriétés que celles qui ont 
été définies à propos du temps. Il en est de même des points répartis dans l’espace. 


d - Application de la loi de Poisson — Une petite route de campagne est fréquentée par 120 
voitures par heure en moyenne. 


1. Calculer la probabilité R1 pour que la route soit fréquentée douze fois en cinq minutes. 
2. Calculer la probabilité R2 pour que la route soit fréquentée au moins une fois en cinq minutes. 
3. Calculer la probabilité Rg pour que la route soit fréquentée au moins sept fois en cinq minutes. 
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Le calcul de À s’effectue sur cinq minutes, on trouve alors : 
120 
à= —— x 5 = 10. 
60 


Il s'ensuit que : 


2: 12 
pia E -= = 9,481072; 


Ro = 1 — Po = 1 — exp(—10) = 0,999 9546 ; 
R = 1- P- Pi — P — P; — P, — P; — Pe; 


102 10 10 105 10° 
R = 1 — exp(—10) Lio PNR RER | = 08600. 


2! 3! 4! 5! 6! 


3. Loi de Gauss-Laplace 


Il nous faut rechercher la valeur asymptotique de P4 lorsque n devient infiniment grand. C’est 
la formule de Stirling qui va nous permettre de développer les factorielles, donc la fonction à 
laquelle nous allons nous intéresser est log, (Px). Il y a alors deux façons de parvenir à nos fins. 
On développe log,(P;) au deuxième ordre ce qui conduit à des longs calculs un peu fastidieux. 
Il est alors nécessaire d’user de la formule de Stirling très complète : 


1 
nl=n'exp(-n)V2rn(l+e,) avec NEn — TA 


Un second procédé, moins rigoureux mais plus simple, consiste à choisir le maximum de 
loge(Pk) comme point autour duquel on effectue le développement en série de Taylor, ce 
qui a pour but de faire disparaître la dérivée première dudit développement. Dans ce cas, 
l'approximation : 


log (n!) & nloge(n) =n 
sera suffisante. C’est cette méthode que nous présentons. On part donc de la relation : 


loge (Pk) = nlog.(n) — n — klog.(k) + k — (n — k) loge (n — k) 
+ (n = k) + kloge(p) + (n — k) loge(q). 


À présent, on cherche le maximum de cette expression, il est donné par : 


dk 


on obtient alors : 


d 
ag lose (Px) = 0 = — loge(k) — 1 + 1+ loge(n — k) +1 — 1 + log, (7) l 


(n mi k)p = kq, 
doù: k=np. 


C’est la valeur la plus probable, mais on a déjà vu que c'était aussi la moyenne m; de la loi 
binomiale. Calculons maintenant la dérivée deuxième : 
d? —1 1 =n —1 —1 1 


l P, = = =) = — 
dk? 08e (Pk) n-k k k(n-k) k (1- En) npq a?’ 
n 


316 


20. LA LOI BINOMIALE, LA LOI DE POISSON ET LA LOI DE GAUSS-LAPLACE 


d’où le développement en série de Taylor : 


log. (Pk) = 108. (Pmax) + O(k — np) 


il s'ensuit que : 


k — z k — 2 
Pk = Pmax EXP (E) = Pmax EXP (E) 


ou encore, si k devient une variable aléatoire continue, la probabilité élémentaire dP = p(x) dz 
que la variable x soit comprise dans l'intervalle (x,x + dx), est donnée par l’expression : 


p(z) dz = Puax EXD (CE) de. 


20? 


La probabilité pour que la variable x soit plus petite que la valeur X s'écrit : 


x 
z- m)? 
P(& < X) = Prax | exp (Se) dzptf 


Il reste à normer la distribution : 


-+00 +00 
k — 2 
1= f P dk = Prax Î exp ( z ai ) dk = o V21 Prax- 
o 
—00 — 00 
De là on tire : 
1 
Prax 2 
ov 2T 


En définitive, on obtient : 


1 k — À 
Pg = exp (Sr) pour le cas discret, et 
oV 2T 20 


X-mı 
2 


1 O 
P(x < X) = Te f exp (5) dz pour le cas continu. 


Cette loi joue un rôle privilégié dans la mesure où de nombreuses distributions admettent la 
distribution de Gauss-Laplace comme loi asymptotique. 


3.1. Propriétés essentielles de la loi de Gauss-Laplace 


La loi est normalisée puisque nous venons de faire en sorte qu’il en soit ainsi. 
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a — Moment du premier ordre 


+00 
m ze (- e) dz 1 fie+mex ( 5) dz 
= X Ses nt Se. 
L ay 2T. j 20? ovr P|—52 


meli) eli) 


La première intégrale vaut m et la seconde est nulle puisque l'expression sous le signe somme 
est impaire. Donc : 


| 


M =m 
b — Calcul de la variance 
+ +oo 
LL m\?2 2 
D(z) = = (x — m)? exp (E) dz = = I z’ exp(~z°) dz. 


Nous allons intégrer par parties cette expression en posant : 
U=T du = dx 


1 
du=zexp(-x?) v= exp(—x?) 


donc : 


Remarque : Dans les problèmes d'évaluation de la précision, on définit la grandeur h = 


2 
qui est appelée mesure de la précision (cf. sur ce sujet, la théorie des erreurs ou incertitudes). 


c — Relation de récurrence entre les moments centrés — On pose : 


Ma = je — m)? exp (En dz. 


On effectue le changement de variable suivant : 


ce qui donne : 


V3 A +00 +00 
My = ee J t exp(—t°) dt = Ky f Tr exp(—t?) dt. 
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L'intégration par parties permet d'écrire : 


+oo 
ma = K; J t1 ltexp(—t?) dt 


+20 
1 FF get 
ne {58 eoe) +2 f 2exp(-8) at] ; 
Dov T 
donc: m = LT J 172 exp(—t?) dt. 
Si l’on remarque que : 
(a42)? 


+00 
1 J t17? exp(—t?) dt, 


on trouve en définitive : 
Ma = (q — 1)o®my-2. 


Comme on connaît les deux premiers moments centrés mo = 1 et m1 = 0, il est aisé de former 
la suite des moments centrés : 


2 


M2 — OC”, 
= 4 

ma = 30 ; 

mé = 150°, 


tous les moments centrés d’ordre impair étant nuls. 
d — La dissymétrie — Elle est donnée par l’expression : 


ms _ M|z - M(x)? 


PR DOPA 


L’étalon étant la courbe de Gauss-Laplace, ô = 0 pour cette dernière. 


e — L'aplatissement — Il est donné par une expression qui est telle que la loi de Gauss-Laplace 
ait un aplatissement nul : 


f — Fonction de répartition de la loi normale — Il s’agit de calculer la probabilité de trouver 
une variable x dans l'intervalle (a,b), sachant que sa distribution obéit à une loi gaussienne : 


(t-m) 


P(a < x < b) = Y(b) — Y (a) = = la (C) dt. 
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Comme cette expression dépend de g et m, on préfère utiliser la variable centrée réduite, ce 
qui conduit à la loi normale réduite. On pose alors : 


T—-m dé 
y= = dy = — 
foj co 


on aboutit alors à la relation : 


on peut encore écrire : 


De plus on a : 


P(—) = 0, 
(+00) = 1. 


En outre, on vérifie que ®(x) est une fonction non décroissante car la fonction de distribution 
est définie positive. 

On trouvera sur le Web (*) le sous-programme gaussleg.h qui permet de tabuler la loi normale 
réduite. 


g — Écart le plus probable — On considère un intervalle de largeur 2E centré sur la valeur 
moyenne, tel qu’il y ait la probabilité 0,5 que l'événement étudié tombe dans cet intervalle. On 
appelle écart probable, l’écart ayant la largeur E. 

Dans le cas de la loi normale, on trouve : 


P(IX — m] < E) = 0,5 = 20 (Z) 1. 


ce qui donne E = 0,6740. 


h — Application numérique — Lorsque p et q ne sont pas trop proches de zéro ou de un, et à la 
condition que n soit grand, on peut utiliser la loi de Gauss-Laplace pour évaluer les probabilités 
des «jeux » relevant du schéma de Bernoulli. 


*http://wuw.edpsciences.com/guilpin/ 
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Exemple n° 1 — On joue 800 fois à pile ou face, et l’on demande quelle est la probabilité pour 
que pile sorte moins de 360 fois (10 % inférieur à la moyenne). 


n = 800; p—g—0,5; m= np = 400; o = /npq = 10V?2; 


soit £ la variable réduite : 


360 — 400 
na T 


il s'ensuit que (attention, ici, £ est négatif) : 


E —2,828 427 125 


i -é 
1 À 1 E 
P(x < £) = F J exp (-5) d=1- f exp (+) dy = 2,345 107°. 


Exemple n° 2 — On réalise 1000 parties d’écarté, quelle est la probabilité de retourner le roi 
plus de 140 fois? 


4 1 7 
n = 1000; P= 3 8: 13; m=np=125; o = ynpq = 10,458; 
soit € la variable réduite : 


__ 140 — 125 


= — = 1 
10,458 1,434 274 33 


il s'ensuit que : 


E 
1 2 
P(e <8) = TE 1 exp (+) dy = 0,076, 


grosso modo entre 7 et 8 chances sur cent. 


i — Une application de la loi des grands nombres — La probabilité d’amener une face bien 
déterminée d’un dé non pipé est a priori p = 1/6. On étudie le rapport entre le nombre de fois 
n où sort la face choisie et le nombre d’épreuves N. 
Combien faut-il d'épreuves pour que la différence entre ce rapport et la probabilité a priori 
soit inférieure à € = 107° en valeur absolue avec une probabilité supérieure à m = 1 — 1076? 
La condition à remplir est donc : 


P(p-<)er 


1" approche -— L'inégalité de Bienaymé-Tchebycheff valable quelle que soit la distribution 
permet de répondre à la question : 


1 
P(|X -m| > te) < PL 
1 
soit encore: P(|X — m| < to) > 1- -> 
12 
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Dans le cas précis, p = 1/6, q = 5/6, o = 4/87, À = 1075, puis : 
t 


N? 
pq 2_ Ne? 6 
E= to = t, = > t — = 10 
N pq 
t 
d'où N= PE =1,410" épreuves. 


L’inégalité de Bienaymé-Tchebycheff donne un nombre d'épreuves obtenu par une majoration 
excessive puisque cette relation ne tient pas compte de la distribution effective de la variable 
aléatoire. Dans le cas où la loi de distribution est connue, le nombre d'épreuves sera très inférieur 
à cette première détermination. 


2° approche — Compte tenu de l’ordre de grandeur du nombre d'épreuves, il est tout à fait 
légitime de faire usage de la loi de Gauss-Laplace. On calcule alors l'écart réduit : 


n 
Ne, 
o © „Pq | 
on a alors : 
+6 
P=- | e (-5) dt = 24 (8) = 1 — 107ê 
V2r J 2 


d'où Y(B)=0,4999995 et  B—4,5. 


On obtient : N = 2,8 10° épreuves. 


4. Changement de variable aléatoire dans les lois de répartition 


Soit y = p(x) une fonction quelconque à dérivée d'(x) positive et continue par morceaux sur le 
segment (0, L), à valeurs sur (a,b) (cf. Fig. 20.1, page ci-contre). 

Soit 7 = @{£) une variable aléatoire, elle-même fonction d’une autre variable aléatoire £. On 
se pose la question de connaître la probabilité de trouver dans l'intervalle (y/,y”) sachant que 
l’on connaît 


g" 


P(x! < £< x") = [ro dz. 


x! 


Soit z = Ẹ(y) la fonction inverse de y = (x), sur l'intervalle (a,b) avec 0 < x < L. On a 
l'identité des événements : 


E{y <n<y”} 
E{(y) <E < Y(y”)} 
et Efr <£<zx"}. 
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Figure 20.1. Changement de variable dans les lois de distribution. 


La probabilité de l'événement £ est donnée par : 


z” | 1028 
P= frte)dr= | pets) de= P SES) =PO <n< y" 
x! Yu) 


Avec le changement de variable x = Y(y), on obtient la probabilité attachée à la variable 7. En 
tenant compte du fait que dx = Ÿ’(y) dy, on peut écrire : 


y" 


y” y” 
P(y <n <y”) = Jrete) de = Jr [T (y) X (y) dy = fre) dy, 


1 1 1 
car g'(x) = —— et (y) = —— = ——. 
o) = TT) TOREO) 
En définitive, on obtient la distribution désirée : 
peltu) si a <y<b 
Pn(y) 4 TC )] 
=0 si y<a et y>b. 


Remarque : Pour éviter les omissions lors des changements de variable dans les fonctions de 
distribution, il suffit de penser à manipuler non pas la distribution f(x) mais la probabilité 
élémentaire dP, c’est-à-dire dP = f(x) dx pour que x soit compris entre x et x + dg, ainsi, 
en effectuant le changement de variable x = g(y}, on obtient : 


dP = f(x) dr = ft) dy = fla(u)1g/(u) dy = hU) dy. 
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Exemple 


On effectue le changement de variable y = z? dans la loi normale réduite : 


pate) = = ep ( S) 


On a donc : x = ,/y, et l’on note la fonction inverse Y = yz. On écrit alors : 


dy 1 
—— z= Y’ y = —— 
dy @) 2/y 
il s'ensuit que: (y) = TE exp ( 2) . 


Attention, la loi de probabilité que nous venons de trouver est deux fois trop petite car : 


1 1 
“T T 4 


P(y <n <y") = P(=x' < E< r") + P(x < £< x”) = J pelz) dx + fr) dz 


1 t 


-T T 


1 


= [rod f zg Pel VI) + PV dy. 


En définitive, la densité de probabilité s’écrit : 


(y) = za =) si y2>0, 


et (y) = si y < 0. 


Cet exemple nous sera de quelque utilité lors de l’étude de la distribution du x2, à m degrés de 
liberté. 
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Certaines opérations mathématiques sont plus commodes à réaliser dans l’espace réciproque de 
Fourier que dans l’espace direct (propriétés des espaces duals). En théorie des probabilités, il 
peut être plus simple de traiter ou bien de la fonction de distribution ou bien de la fonction 
caractéristique. Cela dit, il ne faut pas fonder trop d’espoir sur cette conception, c’est une 
technique parmi d’autres techniques. En effet, on se persuade des limitations pratiques de cette 
méthode en consultant une table d’intégrales de Fourier : il y a peu de cas de figures. Quoi qu’il 
soit, la méthode offre un indiscutable intérêt tant théorique que pratique, aussi allons-nous y 
consacrer un chapitre. 


1. Définition et propriétés 

Soit € une variable aléatoire, la fonction caractéristique est donnée par l’expression : 
S(t) = Mlexp(jtr)] 

où M! ] est opérateur moyenne. 


Si la variable aléatoire est discrète (k entier appartenant (—00; +00)), on écrit : 


+00 


S(t)= $. p(k)exp(jtk). 


k——00 
Il ne s’agit simplement que du développement en série de Fourier de la probabilité. ®(t} est 
une fonction périodique de période unité. 
Si la variable aléatoire est continue sur un intervalle fini ou infini, et si l’on désigne par p(x) 
la densité de probabilité, on écrit : 
+00 
(t) — f p(x) exp(jtx) dz. 
— o0 
Il s’agit de la transformée de Fourier de la densité de probabilité. 
En général, on peut écrire la transformation inverse : 
+00 
i D(t)exp(—jtx) dt. 


—00 


1 


p(z) = 2x 
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1.1. Théorème (sans démonstration) 


Une distribution de probabilité est déterminée d’une manière univoque par sa fonction caracté- 
ristique. 


1.2. Calcul des moments 


Considérons le développement de exp(jtx) : 


n pT A gr+l | 
exp(jtx) = Si Ht + fa où |O| <1. 
Ea | ! 


Si les moments 4y = M{x*] existent pour k = 0,1,2,...,n+1, alors, compte tenu de la relation : 


Mlexp (jté)] Des lik + MIOx Ne 


on peut alors écrire : 


Ra 
Ne k=0 Fa” J (n +1)! Fi 
avec : 
[Ral < Mix] 
Ainsi, on trouve : 
lo = (0) = 1, 


uk =j *&W(0), pour k=1,2,...,n 


On peut donc calculer les moments up = M{x*] à partir des dérivées de la fonction caractéris- 
tique de la variable aléatoire. 


1.3. Propriété de la fonction caractéristique 
La somme des variables indépendantes : 
E= E1 HE2 t:e tEn 
a une fonction caractéristique de la forme : 
P(t) = Pi(t) - Bat)... BA (4) 


qui est le produit des fonctions caractéristiques de chacune des variables aléatoires indépendantes 
E1, 62,-.., En. Cela découle de la relation de définition : 


m> 


M[exp(jtz)] = Mjeipjile +tat-..+2n)] = | | M[exp(jtzr)]. 


k=1 
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1.4. Cas particulier de la somme de deux variables indépendantes 


La fonction caractéristique de la somme de deux variables indépendantes est donc le produit de 
chacune des deux fonctions caractéristiques, soit : 


(t) = Pit) - 2(t). 


La transformée de Fourier inverse va transformer ce produit simple en un produit de convolution, 
nous obtenons : 


+00 
p(z) = Î [he — t) - [L() dt 


expression dans laquelle [[,(t) est la transformée de Fourier de &4(t), k = 1,2. 


1.5. Quelques autres propriétés importantes 


Soit une variable € de densité de probabilité p(x). La fonction caractéristique de cette variable 
s'écrit donc : 
+00 
(t) = | p(x)exp jt dr. 
—c 
La variable £/n, ayant la densité de probabilité np(ny), admettra comme fonction caractéristique 
(après changement de variable) : 


+00 +00 
zT t t 
jZt dr = jŻzdz=ð8(ŁŻ 
TEOG z J ropie T BI 


ce résultat étant obtenu par application directe de la définition. Dans le même esprit, la moyenne 
£ d’une somme de variables indépendantes de même densité de probabilité p(x) : 


1 
z= (mi + r2 +: + En) 


admet comme fonction caractéristique : 


Dans bien des cas, on s'intéresse aux logarithmes de la fonction caractéristique : 
T(t) = log. [8(¢)]. 


En particulier, dans le cas de la dernière variable £, la fonction Y(t) s'écrit : 


D(t) = nlog, [e G) ; 


t t 
Si par hasard ® (2) admet un développement du genre 1 — lorsque n est grand devant 
n 


t, on aura toutes les chances de montrer que £ obéit à une loi gaussienne puisque la fonction 
caractéristique sera gaussienne... 
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1.6. Exercice 


a. Soit deux variables aléatoires indépendantes £1 et £2, qui sont toutes les deux normales 
(gaussiennes) centrées et réduites. Calculer la fonction caractéristique de chacune d'elle, puis 
la fonction caractéristique de la variable n = £1 + £2. En déduire la fonction de distribution 
de 7. 

b. Les variables indépendantes sont toujours gaussiennes mais ne sont plus centrées réduites. 
On désigne par mı et m2 les moyennes respectives et par c et o2 les écarts quadratiques 
moyens. Donner la fonction de distribution de 7 = £1 + £2. 

c. Généraliser le calcul précédent du §b en considérant la variable 


n 
N= Xo tk, 
k=1 


puis en déduire le théorème d’addition des moyennes et le théorème d’addition des variances 
(écart type élevé au carré). 


2. La distribution du x? 


On se propose de rechercher la fonction caractéristique, puis la distribution, de la variable 
aléatoire : 


x = ++... +E 


qui est la somme des carrés de variables aléatoires, indépendantes, gaussiennes centrées réduites. 
Chacune de ces variables gaussiennes variables à une densité de probabilité de la forme : 


1 x? 
exp | -7 avec x € (—00; +00). 


Il s'ensuit que les variables E ont une densité de probabilité de la forme : 


p(y) = a (-5) si y € (0; +00) 
pily) = 0 si y € (—oo; 0). 


Compte tenu de ce que : 
+00 
T(z) = J tt exp(—t)dt (fonction gamma), 
0 


on obtient la fonction caractéristique de la variable E ; 


+00 +00 
1 J | 1 dx 
—— | pk(z)exp(jtr) dr = f 7 
V2r J vr J Vzexp [a -295] 
+00 
1 1 


TAA f 2% expt-2) dx = T(1/2) = (1 — 24jt) Ve 


TEE Vrû 256 
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Il s'ensuit que la fonction caractéristique du x? à n degrés de liberté : 

Œ(t)=(1—2jt) 2? pour t€ (—00; +00). 
Pour obtenir la fonction de distribution, il n’est pas utile de calculer la transformée de Fourier 
inverse, pour cela il suffit de remarquer que : 


+00 
À f x7/2—1 exp (-) exp(jtr) dx = (1—2jt) "2 
0 


A étant un coefficient de normalisation. Donc la densité de probabilité du x? s'écrit : 
z£ 
p(x) = Ar”/?l exp (-5) pour x € (0; +00), 


avec 
1 


A= 2/7 (n/2) 


d’où l'expression de la distribution du x? à n degrés de liberté : 


1 n/2— z 
oo = pra (3) 
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22 |La loi du y? 
et la loi de Student 


L'étude des critères de conformité va nous conduire à étudier la distribution d’une somme des 
carrés de n variables gaussiennes indépendantes (centrées réduites), il s’agit alors de la loi du 
x? à n degrés de liberté. 

Lorsqu'on aborde l'étude de la corrélation et de la régression, l’évaluation des intervalles de 
confiance conduit inévitablement à l’étude de la distribution de Student qui est la distribution 
d’une variable gaussienne (centrée réduite) divisée par la racine carrée de la moyenne d’un x2, 
à m degrés de liberté, ces deux variables étant indépendantes. 

Ce chapitre est donc destiné à la présentation desdites lois qu’il convient de bien manipuler 
pour exploiter correctement les données expérimentales. 


1. La loi du x? 


Nous avons établi au précédent chapitre la loi de distribution d’une somme de n variables 
gaussiennes centrées réduites, indépendantes, élevées au carré et nous nous proposons d’en 
étudier les principales propriétés. Auparavant, nous allons effectuer quelques rappels concernant 
la fonction T(z) (fonction gamma ou fonction eulérienne de deuxième espèce) qui est étroitement 
liée à la loi du x? : 
T{m) = (m—1)! 
r(1/2) = yr 


T(n + 1/2) = 1X3x5x:...(2n—1) 


27 dé 


+00 


et: T(z) = f t7! exp(—t) dt. 
0 


La densité de probabilité de la loi du x2 à n degrés de liberté est donnée par l'expression : 


z/2-1 exp (-5) pour x € (0, +00), 


1 
Pn(z) = PT (n/2) 2 


tandis que la loi de répartition s’écrit : 


1 5 y 
Le n/2—1 LT 
Le PTa) fe exp ( z) dy pour z € (0, +00). 
0 
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1.1. Vérification de la normalité de la loi 


Il s’agit de calculer L,(), on a donc : 


Ln(oo) = pr: exp (2) dy. 


Effectuons un changement de variable u = y/2, on obtient : 


CO 


is 1 m 
Lh(oo) = AS CE) - Jeu) exp(—u) du = 


y n/2-1 exp(—u) du = 1. 
0 


© 


1.2. Calcul de la valeur moyenne 


Nous voulons calculer la moyenne de la variable x2 : 


o0 
Po O 1 n/2—1 y 
0 


le même changement de variable que celui effectué dans le paragraphe précédent permet d’écrire : 


M (x) = = maj” 2 exp( —u) du, 


d’où : 
__2T(n/2+1) 
M (x) = TD 
1.3. Calcul de la variance D (x2) 


Au préalable, on calcule le moment d’ordre deux que l’on note mg : 


1 Co OO 
2. 2,n/2—1 ER n/2+1 y 
ma (Xn) WT (n/2) fe Y exp ( à Me FAGA (n/2) fr SFP = dy 
0 0 
1 
— 2T (n/2 + 2) = 2 
7 PT (nj? /2) (n/ + ) (m + jm 


Comme on a : 


D (xn) = m2 (Xa) — M? [xà]; 


on en déduit : 
D (x2) = 2n. 


On donne sur le Web (*) le sous-programme khi2.h qui permet de tabuler la loi du x2, à m 
degrés de liberté. 


*http://wuw.edpsciences.com/guilpin/ 
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2. Distribution d'une somme de deux variables aléatoires indépendantes 
obéissant chacune à une distribution du x? 


On considère une variable O qui est la somme de deux variables aléatoires indépendantes 
obéissant à une loi du x? l’une à n degrés de liberté, l’autre à m degrés de liberté : 


O = Xn F Xm 
La fonction caractéristique de © est donc : 
(E) = (1-25) PA = 24t) = (1 = 2jt) Pr, 
alors, en faisant n = n + m dans les relations établissant la loi du x2 dans le paragraphe 


précédent, on en déduit : 


+00 
A I gi) 2 1 exp (-5) exp(jtx) dz = (1 — 2jt) (r+m)/2 
0 
avec 


ae 1 
— 2(n+m)/2T|(n + m)/2] 


Il s'ensuit que la fonction de distribution s'écrit : 


p(y) = DIU exp (-$) 


1 
2(r+m)/2T{(n + m)/2] 


on en conclut que la distribution d’une somme de deux variables indépendantes obéissant 
chacune à une distribution du x? respectivement à n et m degrés de liberté est encore une 
distribution du x? mais à m + n degrés de liberté. Il est aisé de généraliser : 


Théorème — Une variable qui est la somme de m variables aléatoires indépendantes obéissant 
chacune à une distribution du x? obéit encore une distribution du x°. 


3. La loi du x? à m degrés de liberté tend asymptotiquement vers la loi 
de Gauss quand m tend vers l'infini 


Exprimons la loi du x2, à m degrés de liberté en variable centrée réduite, en rappelant que 
M{x] = m et D{x] = 2m (o = V2m) : 


__T—m 
"= Von, 


on obtient : 


V2m m/2—1 (V2my + m) 
Pm(y) = 27 PT (m2) (V2my + m) exp eaen 
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Passons aux logarithmes : 


1 — 2 — 2 — 2 
lg. m(u)] = Cste + $ 1oge(m) = Dog. (2) - ME og, (22) 4 ME 


1 m — 2 m — 2 m — 2 y m 
— 3 Be (==) + —z loge(m) + 7 loBe 1+ _ WF 
2 
en remarquant que : 
y 


2 
jm jm m 
2 2 


tous calculs faits, quand m tend vers l'infini : 


log, | 1+ 


y? 
loge [Pm(y)] = Cste — DE 


d’où : 
2 
1 
Pm(y) = Aexp (-£) avec À = —— .- 


On reconnaît la loi normale réduite. 


4. Distribution d’une variable aléatoire fonction de deux variables 
aléatoires indépendantes 


GE 


On considère la variable aléatoire 7 qui est une fonction de deux variables aléatoires indépen- 
dantes x et 7. On désigne par p,(x) et pA(y) les fonctions de distribution de ces deux variables. 
A priori et sans nuire à la généralité, on peut convenir que ces fonctions sont définies sur 


(—00, +00). Nous avons donc : 


LÉ f(æ,y), 


et nous voulons obtenir la distribution p,(t) de la variable aléatoire r. Comme les variables sont 


indépendantes nous avons : 


Pr(t) = pe(z) : paly) 


On cherche à expliciter p,(t). Pour cela on va rechercher la répartition P,(a) pour que 
f(x,y) < a. Cette répartition ne sera rien d'autre que l'intégrale de p£(x) - py(y) étendue 


au domaine f(x, y) < a. Soit : 


P(a) = ff pela): pnl) dx dy. 


f(z,y)<a 
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4.1. Cas particulier n° 1 


Dans le cas où l’on peut écrire x = a®(y), alors on effectue un changement de variables très 
intéressant à savoir : 


v= (y) et æx—=uv. 


Le jacobien de la transformation s'écrit : 


ôx Ôx n ù 
lu, v Əy Oy dv dy 
no du/ dy 


Ainsi, P,(a) devient : 


(2 +00 a 
P,(a) = I du J pelu: v) -py [E7 (v)] S 2 dv = fro du. 


Application au rapport de deux variables indépendantes — La variable a est donc un rapport : 
a= z/y, 
et l’on effectue le changement de variables : 
y=v et y=uv 


dans ce cas, le jacobien de la transformation devient : 


O(z,y) Ww u pa 
ðlu, v) J0 1 
d’où : 
a +00 
P(a)= f du f pe(u-u)-patuo dv 


Remarque importante — Il convient de prendre garde aux signes de la distribution au cas où 
la variable ņ de distribution p,(y) est définie sur (—0co, +00) : 


IL. (u) = EC - v) - pa(v)v dv — 7 pelu- v) - pA(v}v dv. 


En effet une densité de probabilité ne peut pas être négative et, seule, dans ces expressions, 
la variable v change de signe en franchissant la valeur zéro. 


4.2. Cas particulier n° 2 


Dans le cas où l’on peut écrire x = œ + (y), alors on effectue un changement de variables très 
intéressant à savoir : 


v=ð(y) et zx=u+v. 
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Le jacobien de la transformation s'écrit : 


1 1 
alz, y) 1 1 
O(u, v) dw] dv 
dy dy 
Ainsi, P,(&œ) devient : 
Q +00 1 
P,(a) = I du f pelu + v) -py [87 (v)] Tt dv = f pr(u) du x 
‘dy — 00 


— OC — 00 


Application à la somme de deux variables indépendantes — Donc la variable à est une somme, 
on à alors : 
&=Trt+y f 


on effectue alors le changement de variables : 
T=U—V 


y=v et 
dans ce cas, le jacobien de la transformation devient : 
O(x,y) _ [1 —1| _ 1 
lu, v) JO 1 
d’où : 
Q +00 
P,(a) = J du J pelu — v) - p(v) du 


On retrouve le résultat que nous avions établi à l’aide de la fonction caractéristique. 


5, La distribution de Student (W. Gosset) (1876-1937) 


C'est la distribution de la variable aléatoire : 
E 


t= 
NET 
m 


expression dans laquelle £ est une variable gaussienne centrée réduite (indépendante de x2,) de 


_£ 
n 


loi de distribution : 
1 y? 
Ja P (-5) | 


Il sera aisé d’appliquer les résultats du paragraphe précédent lorsque nous connaîtrons la 


2 
distribution p,(y) de la variable 7 = 4/ Xm, Il convient pour ce faire d'effectuer un changement 


de variable : 
y= V= — zx=my pour x € (0, +00). 
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On peut écrire : 
y=8(s) z=V(y)  V'(y) = 2my. 


La distribution devient donc p,(y) = plY(y)]L’(y) soit : 


1 2\m/2-1 my? m”? —1 my? 
ae a m LES 0 = —— y” se 
Pn (y) 2m/2T(m/2) (my ) exp 2 my 2m/2-1T (m/2) y exp 2 


pour æ € (0, +00). 


La distribution pm(t) de la variable t s’écrit alors : 


+00 +c 


Pnl) = | pelto) -plov du = Re [rex () 


0 0 


242 m/2 re 2 2 
y°t m my t 
RUES = m Se pre 
x exp ( 2 E y Orm- (m/2) f» ap | 7 ( + 5] dy, 


0 


on pose : 
my? t? 2 
ME (14e) = E) my avr 
soit 
y == 
on trouve alors : 
m/2 
+oo 
&) mr? Î 2u (u) 1 d 
Pm(t) = exp(—u)-—— du 
m/2—1 2 2 
mv2r2 C(m/2) J |, (+5) (+5) 
m | m 
m/29(m-—1)/2 27-(m41)/2 F2 
= TS a 1+ a f um 1)/2 exp(—u) du 
mv2r2%/2-1T(m/2}mtm-1/2 m ? 


0 
la quantité sous le signe f n’est rien d’autre que l'[(m + 1)/2], en définitive, on trouve : 


_Dm+0/2 [ET 
mO = re HE] 


pour t € (—co, +00). 
m 


5.1. Vérification de la normalité de la loi 


Il s’agit de calculer Am(00), on a donc : 


+00 
T(m + 1)/2 CH 
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Posons y = ymt, nous obtenons : 


+00 
T[(m +1)/2] 21—(m+1)/2 
Am(co) = 2 PDG) D) fur dy 


T{(m + 1)/2] * 
VrT(m/2) 


maintenant, il suffit de poser u = y?, ainsi du = 2y dy et l'intégrale se transforme : 


_ T{(m+1)/2] w- Tlm+i)2,f1m+i 1 
PAC} Ï Fe MAP] (z 2 23) 


—(m+1)/2 


= 2 -ly [1+ y°] dy 


expression dans laquelle B(x, y) est la fonction eulérienne de première espèce qui s'écrit : 
+00 +00 
T(x)T (y ) url ver 1 
B(x, y) = =—<— = du=2 | ——— d 
(&,9) = T{x +y) = | [1 + ujet 5 l [1 + v2]e+v ” 
0 0 
donc : 


T(m +1)/2 T(/2)7(m/2) _ 
VrE(m/2)  Tf(m+1)/2] 


5.2. Calcul du moment du premier ordre 


Amn(oo) = 


Le résultat est nul car la fonction sous le signe somme est impaire. 


5.3. Calcul du moment du deuxième ordre 


Il nous faut calculer : 


Tim À £? 
Dfi] = 2 rl (m/2) (m/2) l ma 7 z mary dé 


Les mêmes changements de variable utilisés pour vérifier la normalité de la loi conduisent aux 
résultats suivants : 


T[(m + 1)/2] y? 
Ne de JE 


Dion T{(m + 1)/2] ($ m — 2) = ML +1)/2] _T(8/2)T(m/2 - 1) 
ose 2 M- Vritm/2) T[(m +1)/2] 
m m 
2m, m-2 
2 
On en conclut que : 
| Vm-2 


22. LA LOI DU X? ET LA LOI DE STUDENT 


On donne sur le Web (*) le sous-programme student .h qui calcule les valeurs de la distribution 
de Student quel que soit le degré de liberté m. 


6. La distribution d'une somme de deux variables aléatoires indépendantes 
obéissant à une distribution de Student est-elle encore une distribution 
de Student ? 


La réponse est non. Soit T = Em + Nn une variable aléatoire somme de deux variables aléatoires 
indépendantes obéissant chacune à une distribution de Student respectivement à m et n degrés 
de liberté. Soit (t) la fonction caractéristique de ém. Nous avons (en prenant la transformée 
de Fourier réelle car la distribution de Student est symétrique) : 


+00 
maD TP eost) 
La yar (m/2) f [1 + y0 
_oDi(m+1)/2] 1 __ zyr 
(t) = D 2 JE) 
2 ; 


expression dans laquelle K,,/2(x) est la fonction modifiée de Bessel de troisième espèce. La 
fonction caractéristique de în s'écrit : 
Tf(n+1)/2] 1 L/T 
P(t) = 2 e © Kalt), 
OX TD 2 F5 m2(t) 
2 


le produit des fonctions caractéristiques donne une fonction que l’on peut écrire d’une façon 
simplifiée : A(m,n)Km/2(x)Kn/o(x). Malheureusement, le produit de deux fonctions modifiées 
de Bessel n’est ni une fonction modifiée de Bessel ni une somme de deux fonctions modifiées de 
Bessel, il s’ensuit que la transformée de Fourier inverse n’est pas une distribution de Student. 


7. La loi de Student à m degrés de liberté tend asymptotiquement 
vers la loi de Gauss quand m tend vers l'infini 


Comme la loi est symétrique, il suffira d'effectuer un développement de MacLaurin (au voisinage 
de zéro). La densité de probabilité s'écrit : 


jo OR Use ee 
ý VTT (m/2) PE (n+1)72 


En passant aux logarithmes, on trouve : 


— 1 — 1 — — 1? 1 
log.(d(x)) = Cste + Z log, (==) — L : + ; loge (~ ) 3 loge (m) 


2 
m — 2 m — 2 m—2 1 m — 2 m +1 x? 
z IA LL E PE A PL PO E E 
2 og ( 2 )+ 2 510g ( 2 ) 2 og ( +5) 


*http://www.edpsciences.com/guilpin/ 
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soit encore : 


m m—1 1 m-i m — 2 
= } l H 
loge (Vm(2)) = Cste + log ==) ju. ( 3 ) og. ( 3 ) 
1 m — 1 1 m +1 x? 
2 AA DEES = 2 
+ g l08e (= 3 z gelm) — log (1+ =) 


m+1 m—1 1 2m(m — 1) m +1 x? 
= Cst l l l 1+— }. 
neeg og. (Z=) log, (D 7 og ( Ta 


Quand m est grand devant l’unité, on peut écrire : 


loge (m(2)) = log.(K) - +. 


expression dans laquelle K est une constante numérique que l’on détermine par normalisation 
de la distribution. On en déduit : 


nt) => Kexp(©). 


1 
On reconnaît la loi normale et par conséquent la constante K vaut = Quand le nombre de 
T 
degrés de liberté croît, la loi de Student tend vers la loi normale. On pourra aussi s’en convaincre 


en consultant directement les tables numériques. 
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23 | Systèmes à plusieurs variables 
aléatoires 


1. Généralités 


Il s’agit de généraliser un certain nombre de notions afin de les étendre aux systèmes de plusieurs 
variables aléatoires et plus spécialement aux systèmes de deux variables aléatoires qui vont 
retenir notre attention lors de l’étude de l’analyse de corrélation-régression. 

L'apport essentiel de ce chapitre sera l’étude de la matrice de covariance et de la matrice de 
corrélation. 


2. Système de variables aléatoires, fonction de répartition 


On considère deux variables aléatoires X et Ÿ qui pourront éventuellement figurer l’abscisse 
et l’ordonnée d’un point du plan. Il est alors tentant de penser que les propriétés du système 
dépendent uniquement de celles de chacune des variables ; il n’en est rien et il convient de tenir 
compte de leur interdépendance. Bien entendu, ces propos se généralisent au cas de n variables 
aléatoires X,,X2,...,X, dont le point figuratif appartiendra à un espace à n dimensions. 


2.1. Définition 


On appelle fonction de répartition d’un système de deux variables aléatoires X et Y, la 
probabilité de vérifier simultanément les deux inégalités : 


X<È et Y<y. 
Elle est définie par l'expression : 
F(E, n) = P(X < &,Y <n) 
(cf. Fig. 23.1, page suivante) et cela revient à dire que F(£,7) est la probabilité de se trouver 
dans le quadrant hachuré de la figure ci-contre. Désignons par ¢(£) la fonction de répartition de 


la variable aléatoire X toute seule, et par 4#(n) la fonction de répartition de la variable aléatoire 
Y toute seule. 
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A(E, n) 


Figure 23.1. Fonction de répartition à deux dimensions. 


2.2. Propriété de F(£, n) 


1. C’est une fonction non décroissante des deux arguments : 


si é>a = F(é,7) > F(a,n) 
si n28 = F(é,n)2>F(n,8). 
2. F(£,-00) = F(—œ,n) = F(—œ, —2œ) = 0. 
3. F(E, +00) = ¢(£) 
4. F(+oo,n) = Ÿ(n) 
5. F( 


2.3. Probabilité pour qu’un point aléatoire (œa, B) appartienne à un domaine rectangle 
parallèle aux axes 


Soient À, B,C et D les quatre sommets du rectangle dont les côtés sont parallèles aux axes. 
À = (a, d) B = (b,d) C = (b,c) D = (a,c). 


Il s’agit en fait de trouver a < a < b et c < 8 < d qui représente la probabilité de tomber dans 
le rectangle : 


P(a, B) = F(b, d) — F(a, d) — F (b,c) + F(a,c). 


Cette probabilité peut s'exprimer en fonction de F{x,y) qui à son tour s'écrit comme une 


intégrale double : 
g£ y 
Fæy)= | f Hap) de ag. 


—00 — 00 
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3. Variables aléatoires liées et indépendantes 


Revenons au cas de deux variables aléatoires X et Y. Le problème fondamental est de savoir 
quelle est la dépendance mutuelle des deux variables (ou l’absence de dépendance). 

On dit que la variable aléatoire Y est indépendante de la variable aléatoire X si la loi de 
répartition de Y ne dépend pas de la valeur prise par X. Soit : 


f{ylz) = dy) quel que soit æ. 


En revanche, si Y dépend de X, on a: 


fui) # (y) pour tout x. 
La dépendance de X et de Y est une propriété mutuelle des deux variables. Autrement dit, si : 


f{uix) = #(y) cela entraîne f(xy) = ¢(2). 


Dans ce dernier cas, on dit que les variables aléatoires sont indépendantes, car la loi de 
répartition de chacune des variables ne dépend pas des valeurs prises par l’autre. Dans le cas 
contraire on dit qu’elles sont dépendantes ou liées. 

Quand X et Y sont des variables indépendantes, la fonction de répartition f(x,y) est le 
produit des fonctions de répartition de chacune des variables X et Y ; soit encore : 


f(x,y) = É(x)d (y). 


Réciproquement, si f(x, y) est le produit de deux fonctions indépendantes (x) et y(y), alors 
les variables aléatoires X et Y sont indépendantes et cela constitue un critère pour juger de 
l'indépendance des variables. 

On peut dire que deux variables sont dépendantes quand elles ont une tendance plus ou moins 
marquée à varier simultanément. 


4. Caractéristiques numériques, covariance, coefficient de corrélation 


Par définition le moment non centré d’ordre (k,s) du système de deux variables X et Ÿ est 
l'espérance mathématique du produit r*y°, et l’on écrit : 


mes = Mx*y]. 
Le moment centré s'écrit : 
Hk,s = M[zġyő], 
en désignant par zo et yo les variables centrées : 
Zo = £ — M10 
Yo = Y — Moi. 


On peut encore écrire : 
Mk, = > > LFY Pij 
i j 
et Hk, = ` ` (zi — m0)" (y; — Mo,1) Piz 
i j 
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expressions dans lesquelles p;; = P(x = x;,y = y;). S'il s’agit de variables aléatoires continues, 
nous écrirons : 


+00 
Mk, s — J| Arten) dz dy 


+00 
Ha I J (€ — ma)" (y — my) (2, y) dz dy. 


D'un point de vue strictement pratique, seuls les moments d'ordre 1 et 2 sont utilisés ; soit : 


Mge = M1,0 = M[zty°] = Mix] 
my = Moi = M{x°y] = My] 


et 


De = m2 = M[z3y9] = M[x5] = D(r] 
Dy = mo2 = Mu] = My] = Diy] 


et ue 


Pour ce qui concerne les moments mixtes, seul le premier joue vraiment un rôle important : 
mai = M{r'y] 

dont la forme centrée s'écrit : 
pı, = Mirvo). 


ceci est simplement la moyenne du produit des variables aléatoires centrées. Ce moment mixte 
porte un nom particulier, il s’agit de la covariance que l’on écrit : 


Kz = > > — Ma )(Yj — My)Pij 


ou Key = JJe — Ma)(y — My) f(x,y) dz dy. 


Kz décrit la liaison de X et de Y. Si X et Y sont des variables aléatoires indépendantes, 
alors Kz y = 0. Autrement dit, puisque f(x, y) = ¢(x)ẹy(y), on a alors : 


+00 +00 
Kay = f (@-méta de f u- mut) ay =0. 
4.1. Remarques importantes 


a — Non seulement K, „ caractérise la liaison de X et de Y mais aussi la dispersion de chacune 
des variables. Ainsi, si une des variables s’écarte peu de sa moyenne (faible variance), il en résulte 
que Kgy reste faible même si X et Y sont étroitement liées. Pour pallier cet ennui, c’est-à-dire 
pour caractériser uniquement la liaison des variables, on définit le coefficient de corrélation des 
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deux variables X et Y en divisant Kz „ par l’écart type de chacune des variables, soit og et ay. 
On définit alors : 


on notera que ce rapport est adimensionnel. Ici encore, si X et Y sont indépendantes, alors 
Try = 0. 

Attention, la proposition réciproque est fausse. Si deux variables aléatoires X et Y ont un 
coefficient de corrélation nul (re = 0), cela ne signifie pas que X et Y sont des variables 
indépendantes. 

Le fait que rey soit nul signifie non pas que les variables soient indépendantes mais qu’elles 
ne sont pas linéairement dépendantes. 

Il est possible de trouver un exemple simple qui montre que des variables X et Y non 
corrélées sont cependant dépendantes. Considérons deux variables aléatoires X et Y réparties 
uniformément à l’intérieur d’un cercle de rayon R centré à l’origine des coordonnées. La densité 
de probabilité s'écrit : 


f(æ,y) =p pour 2? +y’ < R? 
et f(x,y) =0 ailleurs. 


La normalisation de la densité de probabilité donne la valeur de p : 


+00 +00 
1 
1= dz dy = drdy => p=—. 
J| tev z dy Jow P= -ë 


Les variables sont dépendantes puisque, pour y fixé dans le cercle, x ne peut pas prendre n’im- 
porte quelles valeurs, mais seulement celles comprises dans l'intervalle (—1/R2? — y2, /R? — y?) 
ou encore si x = R, y = 0. Exprimons la covariance : elle est nulle puisque la moyenne de x et 
la moyenne de y sont nulles. 


Kay = 0. 


b — Le coefficient de corrélation caractérise non pas une relation quelconque entre deux 
variables, mais une relation linéaire. Quand une des variables croît, l’autre suit une loi linéaire 
au sens des probabilités et le coefficient de corrélation indique le «degré » de cette dépendance 
linéaire. Dans le cas d’une relation fonctionnelle linéaire exacte, on a : 


Tay = +l, 


autrement dit lorsque Y = aX + b. Si la loi de dépendance linéaire est quelconque, alors nous 
avons : 


—1 < fz y < +1, 


la corrélation étant positive ou négative. Nous allons démontrer ces résultats au paragraphe 6. 


5. Généralisation au cas de plusieurs variables 


Il ny a pas de difficulté à étendre ces résultats au cas de plusieurs variables aléatoires 
X1,X0,..., Xn ; ainsi, la covariance et la corrélation se calculent pour toutes les variables prises 
deux à deux. Si les variables sont au nombre de n, alors il y a n? coefficients de covariance et n? 
coefficients de corrélation. Dans chacun de ces deux cas, les coefficients sont naturellement les 
éléments d’une matrice carrée d'ordre n. 
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5.1. Matrice de covariance 
Notons ses éléments k;;. Elle est évidemment symétrique puisque le produit est une opération 
commutative : kj; = kij- 
D'autre part, k; = D; qui est la variance de X;. 
5.2. Matrice de corrélation 


Notons ses éléments r;;. Elle aussi est évidemment symétrique et : 


kij 
Tji = Tij = avec Tij = D;D; et Tii = 1. 
19 


6. Quelques théorèmes importants 


Soient X et Y deux variables aléatoires quelconques ; elles prennent respectivement les valeurs 
T1, £23- -, En, Y1: Y2,- - - Yn- Soit g(x, y) une fonction de deux variables offrant les bonnes qualités 
usuelles de régularité, et p;; la probabilité pour que X = x; et Y = y;. La moyenne de la fonction 
g(zi, yj) est alors donnée par l'expression : 


M(X, Y)] = CD ati y)Pis 


et la forme continue : 


M(X,Y )] = J I g(z, y) f (2,9) de dy 


—o0 


expression dans laquelle f(x,y) est la densité de probabilité des deux variables aléatoires X 
et Y. 
Nous allons utiliser ces expressions en écrivant : 


g(X,Y)=X+Y et g(X,Y)=X-Y. 


6.1. Moyenne d’une somme de variables aléatoires 


Il nous faut calculer M[X + Y] dont l'expression s'écrit : 


n n n 


MIX +Y] = >. X lz: +yjlpi; | = 5 X zipy | + 2: „YiPis 
j=l i=1 


i=1 \j=1 i=1 


n n m 
= > Ti X pi + 5 Ce Dm) . 
i=1 j=1 j=1 i=1 


Or P Lı Pij n’est rien d'autre que la probabilité p; que la variable X prenne la valeur x; et 
De 1 Pij la probabilité p; que la variable Y prenne la valeur yj. D’où les expressions qui suivent : 


MIX +Y] = Yen) + S Y5P5) 
i=1 j=1 


MIX +Y] = MIX] + MIY]. 
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On démontrera évidemment le même théorème en ce qui concerne les variables continues. 
Insistons sur le fait que cette relation est indépendante du fait que les variables aléatoires soient 
indépendantes ou non. Ce théorème est susceptible d’une généralisation simple : 


M D x = 5 MIX. 


6.2. Variance d'une somme de variables aléatoires 


Nous allons calculer D[X + Y}. Après avoir posé Z = X +Y, on passe aux variables centrées 
que l’on indice avec un zéro : 


Zo = Xo + Yo. 
On obtient alors les expressions suivantes : 


DIX +Y] = D[Z] = M [Z] = M [X] + M [YF] + 2M [XoYo] = D[X] + DIY] + 2Ko,y- 


On note alors que la variance de la somme de deux variables aléatoires est la somme et de 
leur variance respective augmentée de deux fois la covariance. 
Ici encore il est intéressant de généraliser à une somme quelconque : 


D D xd = DIX] + 2X Kij, 


i>j 


n n n 
soit encore D | x = + K;ij, 
1 A nai 


îi= i=1 j=1 


et l’on remarquera que la variance de la somme de variables est égale à la somme des variances 
de chacune des variables si celles-ci sont toutes indépendantes. 
6.3. Moyenne d'un produit de variables aléatoires 
Il nous faut calculer M[X : Y] dont nous obtenons l’expression à partir de la covariance : 

Kz, = M [Xo ; Yo] = M [(X — mz) : (Y - my) 
avec 

Mı = MIX] et m,=M[Y]. 

Le développement de l’équation donne : 

Key = MIX -Y| — mM[Y] — myMI[X] + memy 

Key = MIX - Y} -mmy = M[X-Y]- M[X]M[Y] 

MIX -Y] = M|X]|M[Y] + Kz,y- 

Si les variables sont indépendantes, Kz „ = 0, et la moyenne du produit est égale au produit 


des moyennes. On généralise ce théorème au cas d’un produit de n variables aléatoires 
indépendantes : 


M Ù x] = i MIX]. 


i=1 
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6.4. Variance d’un produit de variables aléatoires 
Il nous faut calculer D[X - Y], pour cela posons Z = X -Y : 
DIX - Y} = D|Z] = M [Z] = M[(Z -m.)] 
avec 
Mz = M|X -Y| = MrMy + Kay 
DIX: "= = M |Z? +m? — 2m,Z]| = M |Z?] + m} -2m,M[Z] = M [7°] - må 

M [XV] — 2{memy + Kry) MIX - Y] + (mamy + Kay) 
M |X Y] — 2( (MzMy +K; y) (MeMy + Kry) + (MzMy + Kay) 
M [X° Y°] - (MaMy + Kz u) . 


Dans cette dernière expression, on voit apparaître la covariance. Dans le cas particulier où 
les variables sont indépendantes, la dernière expression se simplifie. Puisque X et Y sont des 
variables indépendantes, il en est de même de X? et Y? ; alors, en tenant compte du fait que 
Kz,y = 0, on peut écrire : 


DIX -Y] = MIX°]M[Y*] - mimi 
soit: DIX-Y]= DIX]: DIY] + mi D[Y] + mi DIX]. 


Si les variables sont centrées, on obtient : 


DIXo - Yo] = D{Xo] + Del. 


7. Propriétés du coefficient de corrélation (démonstrations) 
Si les variables aléatoires X et Y sont liées linéairement : 


y = ax +b, 


alors le coefficient de corrélation vaut +1. En effet, à partir de la covariance on peut écrire : 
Kay = M|Xo-Yo] = MIX — ma) (Y — m,)]. 
En remarquant que My = am, + b 
Kay = M [(X — ms) (aX +b — amz — b)] = aM[X?] — am; MIX] — ams M[X] + am? 
= aM[X?] — ami = aD[X]. 
Reportons cette valeur dans l’expression du coefficient de corrélation : 


r = Key aD[X] 
Ty Cry Oxy 


Il reste à exprimer oy : 


oy = y DlaX +b] = /a2D[X] = jalos. 


On en conclut que Tr, = +1 si a est positif et —1 si a est négatif. 
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Maintenant, il s’agit de montrer que }r;4| < 1 quelle que soit la liaison entre les variables 
aléatoires X et Y. À cette fin, calculons la variance de la variable Z = aX + bY, elle s'écrit : 


D[Z] = DjaX + bY] = a DIX] +? D[Y] + 2abK3,. 
Faisons à présent b = a, puis a = oy et a = —o,, nous obtenons : 
D|Z] = 2020} + 2o,a,Key = 2020 il £ rey]. 
Compte tenu du fait que D[Z] > 0, nous devons avoir : 
geo E O:0yKx,y > 0 
ce qui s’écrit encore : 
|Kzyl| < Ox0y 
et par conséquent : 


[rey] < 1. 
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24 | Critères de conformité 


1. Généralités 


Ce chapitre a pour objet l’étude de critères permettant de tester la validité des hypothèses 
formulées lors de l'étude d’une population parente. Il nous faut donc définir ce qu’est une 
population parente. L'étude du caractère stochastique d’un système réel (physique) conduit à 
l'étude de la loi de distribution de la dispersion aléatoire touchant aux mesures effectuées sur 
ledit système. La loi est propre au système qui est soumis à un ensemble de conditions réelles 
d'observations. Par exemple, on peut évoquer la dispersion du tir d’un certain canon alimenté 
par des munitions d’un certain lot ; bien d’autres conditions peuvent influencer la dispersion : 
l'expérience du tireur, la météorologie... 

Une certaine mesure effectuée sur le système est alors caractérisée par la variable aléatoire £, 
accompagnée de sa distribution p(£), c'est-à-dire de la loi permettant d'obtenir la probabilité 
objective de trouver l'événement x dans l'intervalle Ax. 

On appelle population parente l’ensemble de toutes les observations possibles qui pourraient 
être réalisées pour un système soumis à un ensemble de conditions. Il faut bien noter que 
l’ensemble de toutes les observations (réalisations) possibles est différent de l’ensemble des 
valeurs possibles de la variable aléatoire £. À chaque valeur fixée de £ correspond plusieurs 
voire une infinité d'observations possibles ; par exemple, on jette trois dés de couleur différente 
mais par ailleurs parfaitement identiques, et l’on s'intéresse à la somme présentée par les faces 
supérieures : on compte zéro si la somme est inférieure à 12 et 1 si la somme est supérieure ou 
égale à 12. La variable aléatoire £ attachée au lancement prend les valeurs zéro et un tandis 
qu’il y a 216 configurations ou observations possibles, 135 configurations donnent une somme 
inférieures à 12 et 81 configurations une somme supérieure ou égale à 12. 

Donc une population parente est définie par des objets sur lesquels on pratique la mesure 
d’une certaine grandeur. D’une part les objets sont très bien définis (ensemble de conditions) 
et d'autre part la mesure effectuée est sujette à des fluctuations incontrôlables ; en conséquence, 
à celle-là il est associé une variable aléatoire. Par exemple, on peut s'intéresser à la longueur 
des feuilles des arbres d’un parc. Les conditions sont donc constituées par toutes les feuilles de 
tous les arbres du parc. Toutes les feuilles ainsi définies constituent une population parente. Les 
valeurs possibles de la variable aléatoire À seront, d’un point de vue pratique, en nombre fini; 
elles peuvent être mesurées au millimètre près. Une autre population parente pourra être toutes 
les feuilles de tous les chênes du parc ou encore toutes les feuilles de tous les peupliers. 
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Généralement les populations parentes étudiées sont finies, mais on est tenté d'imaginer 
des populations parentes infinies qui sont des extrapolations pour un nombre infini d’obser- 
vations possibles. Cette notion peut alors se révéler commode dans l'élaboration d’une théorie 
mathématique. 

Un échantillon est un prélèvement fini à l’intérieur d’une population parente, et le nombre n 
d'observations constituant l'échantillon est appelé la taille de l’échantillon. Le prélèvement de 
l'échantillon doit être fait au hasard et chaque élément de l'échantillon doit être indépendant 
des autres, c’est ce qu’on appelle l'indépendance stochastique. Au cours de ce chapitre, on verra 
comment contrôler la qualité de l'échantillon prélevé. 


2. Représentation des données numériques. Histogramme 


On se trouve en présence d’un échantillon de taille N prélevé au hasard dans une certaine 
population parente, l'échantillon étant caractérisé par un ensemble de mesures que l’on note 
{æi}i = 1,2,...,n. Il est fondamental de connaître la loi de distribution à laquelle obéit 
l'échantillon. Pour ce faire on va procéder à une représentation graphique des données groupées 
que l’on obtient en comptabilisant le nombre de données appartenant à un petit intervalle. De 
façon pragmatique, on opère de la manière suivante : 


1. on recherche la borne inférieure Zins et la borne supérieure £sup de l’ensemble des {x;}, et cela 
nous définit l'intervalle de représentation noté I; 


2. on divise l'intervalle 7 en k sous-intervalles égaux de telle sorte que k soit compris entre 8 et 
25. Pour cela, on peut utiliser la règle approchée : 


k = log, n +1, 


3. on compte dans chaque sous-intervalle le nombre mx d'individus qui y tombent. 


La courbe représentative des mx en fonction de k s'appelle un histogramme, elle donne une 
représentation de la densité de probabilité à laquelle l’échantillon obéit, ou peut obéir. 

À partir de cette représentation, nous allons chercher à déterminer les propriétés réellement 
stables qui caractérisent le phénomène étudié. Ceci signifie corrélativement que l’on cherchera 
aussi à éliminer tout le côté aléatoire apparaissant dans la série finie des mesures. 

L’aboutissement de la recherche des éléments stables sera donc une loi que l’on dira stochas- 
tique par opposition à loi causale. Stochastique est un mot d’origine grecque — 6 otoyaoths — 
qui signifie le devin, celui qui conjecture. 

On retrouve ici une généralisation de la notion d'incertitude en physique, laquelle accompagne 
inévitablement la réalisation de la mesure. La dispersion de la mesure obéit à une loi stochastique 
— la plupart du temps gaussienne. 

Une fois obtenue la représentation de la densité de probabilité, on recherche une expression 
analytique pouvant «raisonnablement » rendre compte de la loi expérimentale obtenue. 

Sur le Web), on trouve le programme histog.c qui réalise l’histogramme d’une série de 
nombres aléatoires à distribution gaussienne. 


*http://www.edpsciences.com/guilpin/ 
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3. Conformité entre une répartition théorique et une répartition 
expérimentale (ou répartition statistique) 


Après avoir soigneusement examiné la répartition expérimentale, on est en mesure de pres- 
sentir une loi analytique susceptible de représenter théoriquement l’ensemble des données de 
l'échantillon. 

Inévitablement, il existe des écarts entre la loi expérimentale et la loi théorique, et le problème 
de fond consiste à pouvoir dire si ces fluctuations sont dues au hasard ou non, et surtout 
avec quelle probabilité. En effet, la représentation de la loi expérimentale est intimement liée à 
l’échantillon étudié. Un autre échantillon donnera une loi expérimentale plus ou moins différente, 
ainsi qu'un suivant. Donc, le problème concernant la conformité de la loi expérimentale et 
de la loi théorique repose uniquement sur la taille restreinte de l'échantillon (nombre réduit 
d'observations). Ce problème devient caduque si l’on étudie toute la population parente, alors, 
il n’y a plus qu’une seule loi expérimentale possible. 

La recherche d’une loi théorique consiste donc à formuler une certaine hypothèse H et l’on 
veut savoir si cette hypothèse est conforme aux données expérimentales. En fin de compte, on 
veut savoir si l’on peut ou non adopter cette hypothèse H et avec quel degré de certitude. 

Il s’agit donc de définir une mesure de la conformité que rien n'empêche dès maintenant 
de désigner par U. Force est de remarquer que Ü est une variable aléatoire dont la loi de 
répartition sera a priori liée à la distribution de la variable aléatoire étudiée x et de la taille n 
de l'échantillon. 

Si l'hypothèse est correcte, la loi de répartition de U est déterminée par la loi de répartition 
de x et par le nombre n. Désignons par v la valeur particulière prise par la variable aléatoire 
U dans une expérience bien déterminée. Alors notre problème de conformité consiste à savoir si 
la valeur calculée v s'explique par le hasard ou encore si la valeur v est trop grande et indique 
alors une différence essentielle entre les deux répartitions théorique et statistique. Ce dernier 
cas de figure montrerait alors que l’hypothèse H devrait être rejetée, mais cela n’est pas aussi 
simple que les apparences le montrent. 

Après avoir déterminé la valeur numérique v, on calcule la probabilité pour que la variable 
aléatoire U puisse effectivement dépasser v. Soit P cette probabilité. Si P a une valeur «trop 
petite », on doit alors rejeter l'hypothèse H, elle apparaît alors comme peu vraisemblable. 


Choix de la mesure de U 


La première difficulté rencontrée pour choisir une mesure de U repose sur le fait que la répartition 
de Ü dépend de la répartition de x. Il se trouve fort heureusement que, dans certains cas, la loi 
de répartition de U a des propriétés simples, et, pour n grand devant l’unité, cette loi ne dépend 
plus de la loi de répartition des +. Nous allons voir deux mesures de U. 


4. Le x2 de Pearson (1857-1936) 


On désigne par p; la probabilité théorique de tomber dans l'intervalle i, et par J; la probabilité 
expérimentale de tomber dans le même intervalle. 

Pour la mesure de U, on choisit la somme des carrés des différences (p; —5;)? que l’on pondère 
par le coefficient c;. c; tient compte des valeurs relatives des écarts quadratiques à Ap; égal, 
l'importance étant plus grande si Ap; est petit. C’est la raison pour laquelle on prend c; = a/p, 
c'est-à-dire proportionnel à 1/p;. 
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Si l’on choisit a = n, il est possible de montrer que la fonction de répartition de U ne dépend 
pratiquement pas de la fonction de répartition F(x), ni de n, mais uniquement du nombre 
d’intervalles de regroupement k qui a servi à construire l’histogramme. Dans ce cas, on dit que 


U obéit à une loi du x?, et l’on a : . ; 
(pi — Di) 
u=n > aA 
i=l Pi 


u est la valeur numérique de la conformité. On trouvera plus loin une démonstration de ces 
affirmations (cf. §14.1 Annexe H, p. 443). 


Remarque 1 : La loi théorique dépend de u paramètres inconnus que l’on va chercher à 
déterminer. 

Remarque 2 : n est le nombre d'observations indépendantes de la variable aléatoire x, et k 
le nombre d'intervalles de regroupement. Il est nécessaire d'obtenir un nombre minimum de 
plusieurs unités — voire une dizaine — dans chacun des intervalles de regroupement. Si tel n’est 
pas le cas, il faut regrouper certains intervalles pour qu’il en soit ainsi. 

Remarque 3 : La variable U obéit à une loi du x? à m degrés de liberté lequel est déterminé 
par le nombre d’intervalles de regroupement k moins le nombre de contraintes auxquelles est 
soumise la loi. Ces contraintes sont constituées par le nombre de paramètres inconnus y figurant 
dans la loi théorique auquel il convient d’ajouter la valeur 1 car il y a une contrainte implicite 
qui est la normalisation de la loi de distribution. D'où : 


m=k-p—1. 


Remarque 4 : Il n’y a pas de difficulté à calculer la probabilité 0 de dépasser la valeur numérique 
u, soit en ayant programmé la loi du x? à m degrés de liberté, soit en consultant une table figurant 
à la fin de tous les manuels. Si cette probabilité 8 est très petite, on rejette l'hypothèse H avec 0 
chances de la rejeter à tort. Dans le cas contraire, l'hypothèse H est vraisemblable c’est-à-dire 
qu’elle n’est pas en contradiction avec les données expérimentales. 

Remarque 5 : Parler de probabilité très petite n’a pas grand sens si l’on ne se fixe un seuil 
de signification a. D'un point de vue pratique, si 0 est inférieur à 0,05, il y a lieu de vérifier si 
possible l'expérience, et si les écarts persistent, il y a lieu de chercher une autre loi. Cela signifie 
que l’on prend le risque de rejeter à tort l’hypothèse H avec 5 chances sur cent... 

Remarque 6 : Le test du x? est à rapprocher de la preuve par neuf. La preuve par neuf ne dit 
pas quand l'opération est juste, elle dit seulement quand elle est fausse. Autrement dit, si la 
preuve par neuf ne donne pas, lors du processus de calcul, les deux derniers nombres identiques, 
on est certain que l’opération est fausse. En revanche, si les deux dernières opérations sont 
identiques cela signifie que l’opération peut être correcte ou encore que, s’il y a une erreur, 
l'erreur est modulo 9. Il en est de même du x?. On peut aisément trouver plusieurs lois tout 
à fait acceptables qui peuvent rendre compte correctement de la statistique d’un échantillon 
donné. Le critère du x? ne permet pas de dire qu’une loi est meilleure ou pire qu’une autre. 
Simplement, nous savons que les données expérimentales ne sont pas en contradiction avec les 
différentes hypothèses formulées. 


4.1. Un exemple — Vérification d'un générateur de nombres aléatoires gaussiens 


À partir d’un générateur de nombres aléatoires à distribution uniforme, on se propose de 
fabriquer un générateur de nombres aléatoires gaussiens. Notre hypothèse H est donc la loi 
de Gauss-Laplace. Nous avons généré 4096 nombres aléatoires gaussiens en choisissant la 
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valeur moyenne 6,0 et l'écart type 2,0 (nous avons ajouté chaque fois 12 nombres aléatoires 
à distribution rectangulaire donnés par la technique de Lehmer). Les résultats obtenus sont 
présentés dans le tableau 24.1. 


Tableau 24.1. 


k=0 m = 4 z = —3,096 p= 8,037e— 4 p* = 9,766 e — 4 
k=1 m = 18 x = —2,620 p=3417e—3 p* = 4,395e —3 
k =2 m = 48 x = —2,144 p=1,169e — 2 p* = 1,172e- 2 
k=3 m = 130 x = —1,668 p= 3,167e -2 p* = 3,174e —2 
k=4 m = 294 æ = —1,191 p = 6,904e — 2 p* =7,178e — 2 
k=5 m = 481 z = —0,7153 p = 1,205e — 1 p* = 1,174e — 1 
k=6 m = 667 æ = —0,2391 p = 1,683e — 1 p =1,628e — 1 
k=7 m = 765 x = 0,2370 p = 1,882e-—1 p* = 1,868e — 1 
k=8 m = 724 z = 0,7132 p= 1,684e — 1 p* =1,768e—1 
k=9 m = 498 x = 1,189 p= 1,207e— 1 p* =1,216e-—1 
k = 10 m = 267 x = 1,665 p = 6,925e — 2 p* = 6,519e — 2 
k=11 m = 141 r = 2,142 p = 3,180e — 2 p* = 3,442e — 2 
k = 12 m = 41 x = 2,618 p=1,169e — 2 p* = 1,001e — 2 
k = 13 m = 13 x = 3,094 p = 3,438e — 3 p* = 3,174e —3 
k = 14 m = 4 z = 3,570 p = 8,092e — 4 p* =9,766e —4 


Dans ce tableau, k est le numéro de l'intervalle de regroupement, m le nombre d’occurrences, x 
est l’abscisse du début de chaque intervalle, p la probabilité théorique de tomber dans l'intervalle, 
et p* la probabilité empirique. 

Expérimentalement, on trouve que les nombres pseudo-aléatoires gaussiens ont une moyenne 
de 6,05 et un écart type de 1,98. Comme le montre le tableau, nous avons effectué les 
regroupements sur 15 sous-intervalles. Nous avons alors obtenu la valeur de u = 7,601, comme 
l'hypothèse à tester est la loi normale, le nombre de degrés de liberté est 12. Ainsi, la probabilité 
de dépasser la valeur u est 0,815. Il n’y a aucune raison de rejeter la loi de Gauss comme 
hypothèse H, les données expérimentales ne la contredisant pas. On dit aussi que l’hypothèse 
H est tout à fait vraisemblable. 


4.2. Remarques sur le seuil de signification 


Le choix du seuil de signification a est guidé par les conséquences qui pourraient découler du 
rejet à tort ou de la conservation à tort de l'hypothèse H. En l’absence de toute considération 
sur les risques encourus, le seuil de signification le plus répandu est 0,05. Cela signifie que l’on 
choisit de rejeter la loi avec 5 chances sur cent de la rejeter à tort. 

D'un point de vue pratique, après avoir calculé u, on opérera selon l’un des cas de figure 
suivants : 


a. la valeur de u peut se situer dans deux domaines : le domaine des valeurs possibles u < x?_, 
et le domaine des valeurs improbables u > x?_,,, expressions dans lesquelles a est le seuil de 
signification. Alors dans cette dernière éventualité, on rejettera l’hypothèse H avec à chances 
sur cent de la rejeter à tort; 
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b. on peut avoir des raisons particulières de se méfier des valeurs de u trop petites et le domaine 
des valeurs possibles devient u > x2 et le domaine des valeurs improbables u < x2. Dans la 
dernière éventualité, on rejettera l’hypothèse H avec a chances sur cent de la rejeter à tort ; 

c. on peut aussi avoir des raisons de se méfier à la fois des valeurs trop petites et trop grandes 
de u, autrement dit on se méfie des valeurs de u qui se situent dans les queues de distribution. 
Le domaine des valeurs probables devient x2 p <4u < Ni j2 € les domaines des valeurs 
improbables u < x? petu> Ka 72. Dans la dernière éventualité, on rejettera l'hypothèse 
H avec a chances sur cent de la rejeter à tort. 


5. Critère de Kolmogorov (1903-1987) 


Il s’agit d’un critère de mesure de la conformité (ou de la non-conformité) qui présente un grand 
intérêt dans la mesure où il est très simple d'emploi. Ici la mesure de la conformité v est le sup 
du module de la différence entre les répartitions théorique F(x) et expérimentale F*(x). Donc : 


v = sup |F (x£) — F* (x)|. 


Bien entendu, v est une variable aléatoire. Là encore, il est possible de montrer que la répartition 
de v ne dépend pas de F(x) à condition toutefois que la taille de l'échantillon n soit très 
grand devant l’unité (n est le nombre d'expériences indépendantes). La probabilité de l'inégalité 
vyn > À est donnée par l’expression : 

OO 


PO) = 1 $ (1) exp (2) = 29-1)" exp (2 X?) . 


(ee) 


Voici quelques valeurs de p(A) : 


À 00 05 10 1,5 20 
p(à) 1,0 0,964 0,27 0,022 0,001 


Pour utiliser le critère de Kolmogorov, il suffit de : 


a. calculer v puis v4/n, 
b. chercher dans la table de p(À) la probabilité correspondante. 


C’est la probabilité que l’écart maximal entre les deux répartitions soit non inférieur à la valeur 
observée, à condition toutefois que les écarts soient dus uniquement à des facteurs aléatoires. 


Remarque : On notera l’absence de degré de liberté dans l'expression de ce critère. Il s'ensuit 
qu’il est plus «optimiste » que le précédent critère. 


Le programme kolmogor.c sur le Web (*) calcule les valeurs de cette distribution. 


6. Estimation des paramètres d’une loi inconnue. Estimateurs 


La formulation d’une hypothèse H conduit à exprimer une certaine loi dont on recherchera 
l’éventuelle conformité. Les paramètres intervenant dans la loi devront être estimés à partir 
de l'échantillon. Il faut bien préciser que ces estimations sont des variables aléatoires et nous 


* http://wuw.edpsciences.com/guilpin/ 
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n’avons pas accès à la valeur exacte de chacun des paramètres et nous devrons nous contenter 
de l’estimation du paramètre considéré. 

Pour obtenir une estimation, il faut employer un estimateur, la notion d’estimateur va se 
préciser dans les lignes qui suivent, toutefois on peut d’ores et déjà dire qu’il s’agit de la formule 
mathématique utilisée pour effectuer le calcul de l'estimation. Bien sûr, on ne choisit pas les 
estimateurs n'importe comment et il est souhaitable que quelques contraintes judicieusement 
choisies nous aident à déterminer des estimateurs les plus «performants » possibles. Par exemple, 
on peut souhaiter avoir les estimateurs pour lesquels les erreurs sont les plus petites possibles ; 
à ce sujet on se souvient que si n est élevé, nous avons une très grande chance de trouver la 
moyenne expérimentale proche de la moyenne théorique (théorème de Bernoulli). 

D'une façon générale, on peut considérer une variable aléatoire X qui prend les valeurs 
£1, £2, Z3, . . , Zn, puis un estimateur & du paramètre a qui est une grandeur associée à la variable 
X. Toutes les estimations possibles de a le sont à partir des valeurs {z+}. Il s’ensuit que à est une 
fonction des {z+}. Par conséquent, & est une variable aléatoire dont la loi de répartition dépend 
de celle de X ; elle dépend aussi du paramètre inconnu a ainsi que du nombre n d'expériences. 

Ces remarques ne suffisent pas à concevoir des estimateurs intéressants et utiles, on leur 
impose donc certaines contraintes dont les trois plus importantes sont les suivantes : 


1. l’estimateur à doit converger vers a en probabilité. On dit alors que l'estimation est consis- 
tante ; 

2. on souhaite que M{a] = a; lorsque cette condition est remplie, on dit que l’estimateur est 
non biaisé. Le plus souvent le biais dépend de n, et l’on parvient à corriger l’estimateur afin 
que sa nouvelle expression ne soit plus biaisée; mais il convient alors de le vérifier ; 

3. souvent, on désire que l'estimation centrée possède la variance la plus petite possible, c’est- 
à-dire que D(ä) soit minimum. 

La plupart du temps, il n’est pas possible de satisfaire simultanément ces trois contraintes, et 
l’on se contente seulement des deux premières. 


6.1. Application à l'estimation de la moyenne et de la variance 


Revenons à notre variable aléatoire X à valeurs 21,%2,%3,...,2n, et désignons par m et D 
respectivement la moyenne et la variance, toutes deux inconnues. 


a — Cas de la moyenne — Nous définissons la moyenne au moyen de l'expression : 


1 n 
M [m] = n ) Tk. 
k=1 


En vertu de la loi des grands nombres (théorème de Bernoulli), l'estimation m converge en 
probabilité vers m. 

À présent, supposons que l’on réalise n’ expériences ayant fourni chacune une moyenne mj, j = 
1,2,..., n’. On peut écrire : 


1 n’ 1 nn! 
Mr] = = Dm, = = Dai m) 
j=1 i=1 


on voit alors que l’estimateur n’est pas biaisé, et que la moyenne de la moyenne est encore la 
moyenne. En ce qui concerne la variance de m : 


m 1 
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il faut connaître la loi de répartition de X pour pouvoir conclure. Notamment, il est possible 
de montrer que si X obéit à une distribution gaussienne, la variance de m est alors minimum. 
Cela n’est généralement pas vrai avec d’autres lois de répartition. 


b — Cas de la variance — L’estimation naturelle de la variance est la variance statistique : 


Gi 
zle 


(£k - m}? 
"3 1 

avec m= — 
n 


Comme D est égal au moment du deuxième ordre non centré moins le carré de la moyenne, on 
peut encore écrire : 


GE 


1 n 
SGA 
k=1 
2 


15%, x? converge en probabilité vers M[X?] tandis que m converge en probabilité vers m?. 
Donc D converge en probabilité vers M [X?] — m? et par conséquent l'estimation converge cor- 
rectement en probabilité (estimation consistante). Maintenant, nous allons voir que l’estimation 
est biaisée, pour cela nous allons transformer D : 


Dh |ia] = AS Hdi md Do) 
k=1 


k=1 i=1 jži 


2 


soit encore : 


- n-li 2 LA 
D= n2 k 7a y TiT; 
k=1 i=l ji 


À présent, étudions la moyenne de D au travers de cette dernière expression dans laquelle on 
numérote les expériences (on fait K expériences dans lesquelles chaque échantillon contient n 
individus, les Kn individus sont tirés au hasard indépendamment les uns des autres) : 


K n n n | 
-PLD taiu [Sa] -hu [EDan 
j=1 ł=1 


i=1 jžżi 
Comme la variance est indépendante du choix de l’origine, alors on peut choisir l’origine des 
abscisses pour chacune des du en Mmk. En e Yki = Tki — Tık, On obtient alors : 


M[D] = D* = Ei Yki — 75 5 YkiYkj 


k,i,j+i 


la dernière somme affectée d’un signe moins est nulle car les y,; sont des variables aléatoires 
centrées indépendantes pour lesquelles j est différent de à (il ny a pas de termes au carré). 
D'où : 


= ln-1 2 m=i. 1 2 n—1 
MID] = > n2 De Ju D. 
k,l k,l 
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Donc, la moyenne de D n’est pas égale à D, et l’on dira que D est un estimateur biaisé puisque 
l’on commet une erreur systématique en l’utilisant. On corrige aisément en prenant l'opérateur 
D* =D . On démontre sans peine que ce nouvel estimateur est consistant puisque z 
tend mE 1 quand n tend vers l'infini et qu’il n’est pas biaisé. En revanche, dans le cas général, 
l'estimation ne donne pas un D minimum. 


Remarque : Ceci justifie le fait que de nombreux ouvrages donnent : 


HLen 


n 
D = 
k=1 


comme estimateur de la variance. 
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25 | Étude des dépendances 
dans le cas linéaire 


Notre étude se limite au cas de deux variables aléatoires dont la dépendance est linéaire. Ici 
encore il ny a pas de difficultés à généraliser les résultats au cas d’un système dépendant 
linéairement de n variables puisqu'il suffit d’en effectuer l'étude en combinant deux à deux les 
variables. 

Si par malheur la liaison entre deux variables est de type curviligne, on peut chercher alors 
à se ramener au cas linéaire par un changement de variables adéquat. Quoi qu’il en soit, le but 
ultime est l’usage de la méthode des moindres carrés appliquée au calcul des paramètres de 
la « droite de régression » quel que soit le schéma de dépendance linéaire que l’on étudie. Le 
risque principal se fonde sur l’utilisation d’estimateurs qui peuvent devenir biaisés lorsque les 
conditions requises d’applicabilité de la méthode des moindres carrés ne sont pas toutes vérifiées. 


1. Les types de schémas de dépendance linéaire 


1.1. Les deux variables X et Y ne sont pas aléatoires 


Y est complètement déterminé par la connaissance de X. À première vue cela peut paraître 
en désaccord avec la théorie des incertitudes mais ce schéma se rencontre chaque fois que l’on 
aborde un problème de dénombrement, à ce moment aucun élément aléatoire ne rentre en jeu. 
Il s’agit alors d’une dépendance fonctionnelle classique qui prend la forme : 


Y = aX +b. 


Voici un exemple simple : l’âge d’un arbre en fonction du nombre de ses anneaux. 
1.2. Dépendance de la variable aléatoire 7 et de la variable non aléatoire x 
(schéma de régression) 


Ici, on étudie le comportement de la variable aléatoire dépendante 7 en fonction de la variable 
non aléatoire z. Par exemple, la variable aléatoire ņ est une mesure entachée d'incertitude ; 
elle prend des valeurs qui sont influencées par x mais aussi par des facteurs incontrôlables. La 
dépendance linéaire s’écrira sous la forme : 


n = (ax +b) +6. 
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expression dans laquelle les termes entre parenthèses expriment la dépendance non aléatoire et 
ô exprime le résidu, c’est l'expression aléatoire de 7. Dans ce schéma, 6 doit vérifier un certain 
nombre de conditions : 


M{é] = 0 
et D[6] = 0”, 


alors, on ne recherche qu’un schéma en moyenne pour zx, c’est-à-dire une loi de variation de la 
moyenne conditionnelle M{n|x] en fonction de x. Il s'ensuit que la valeur moyenne de 7 est une 
fonction linéaire de z : 


y = àx +b, 


cela signifie que y(x) est la moyenne de 7 pour une valeur donnée de x. La droite ainsi définie 
porte le nom de droite de régression ; cette dénomination doit être prise comme un simple nom 
générique, elle est historiquement liée aux travaux de Galton (1822-1911) — considéré comme 
un des fondateurs de la méthode statistique — qui avait constaté que, durant ses premiers 
travaux, la pente de la droite en question était négative d’où l’idée de régression. 

Le coefficient de la pente à s'appelle coefficient de régression de y en x. 


Tableau 25.1. 
I; 
J gzj = J'(J' +1) yj = log. (2) 
Sj 
5 30 4,196 
11 132 - 3,47 
12 156 3,37 
13 182 3,333 
14 210 3,176 
15 240 3,196 
16 272 2,980 
17 306 2,941 
18 342 2,823 


Exemple — L'analyse de la structure fine des bandes d’émission d’une molécule diatomique — 
ici H Al — permet la détermination de la température du plasma émetteur. Pour cela on mesure 
la surface relative J; de chaque raie à laquelle un produit de nombres quantiques J'(J' + 1) est 
associé. La théorie permet d'établir que : 


I; A 
log, | > )=-=J'(J'+1 
expression dans laquelle S; est calculé pour chaque raie j, À est un coefficient connu attaché à 
la molécule étudiée. Sur un graphique, on porte en abscisse J’(J’ + 1) et en ordonnée la valeur 


- . La mesure de la pente de la droite permet de calculer T. Sur le tableau 25.1 


I 

yj = loge 
j 
on a porté les résultats. 
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La variable z; n'est pas du tout entachée d’erreur tandis que la variable y; est sujette à 
certaines fluctuations incontrôlables qui confère à cette variable un caractère aléatoire. 

Ce type de schéma s'applique encore même si la variable x; fait l’objet de très faibles 
fluctuations comparées à celles qui affectent la variable y;. 


1.3. Dépendance de la variable aléatoire 7 et de la variable aléatoire € (schéma de corrélation) 


Les deux variables étudiées dépendent d’un ensemble de facteurs incontrôlables qui rendent 
fondamentalement aléatoires les variables étudiées 7 et £. 

Si l’on fait l'hypothèse d’une liaison linéaire entre ņ et £, la grandeur 7 se décompose en deux 
parties : 


n= (Gé +b) + ô. 
expression dans laquelle ô exprime le résidu avec comme caractéristiques : 


M[ô] = 0 
et D[ô] = 0°. 


Il y a une contrainte supplémentaire : cette décomposition doit être effectuée de telle sorte 
que les variables ô et £ soient non corrélées. Cela impose que M[6£] = 0, en effet ô est centrée, 
il n’est donc pas nécessaire que € le soit. Si la distribution de ces deux variables ô et € est 
gaussienne, alors on est assuré de l'indépendance. 

Ici encore on s’intéressera à la loi en moyenne et l’on écrira : 


Y(x)=aär+b, soit encore Y(x) = M{nl£ = x]. 
Remarque : Le cas où les variables y et £ sont simplement entachées d’erreur ne rentre pas tout 
à fait dans ce type de schéma bien que ce soit celui-ci qui soit appliqué. En effet désignons par 
Ôx et ôy les erreurs qui entachent les variables x et y. On peut écrire : 


E=t+ôs et n=y+ðy 


et l’on ajoute : 


Remplaçons x et y dans l'équation de la régression : 
n — y = à(£ — ôs) +b 
qui se transforme : 


n =£ +b+ (ôy — 0x). 


Dans ce schéma, on voit que le résidu est corrélé avec € puisqu'il dépend du paramètre à à 
estimer. Cela peut entraîner des ennuis dans le calcul des estimateurs qui risquent de perdre 
leurs bonnes propriétés évoquées au chapitre 24. 
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2. Fondements de l’analyse de corrélation-régression 


La détermination des coefficients & et b s'effectue selon la méthode des moindres carrés. 
Pour s’assurer que les estimateurs issus de l’analyse de corrélation-régression sont tout à fait 
convenables, on doit vérifier que trois conditions suivantes sont remplies : 


1. indépendance stochastique des résultats d'observation (l'échantillon a bien été tiré au hasard) ; 
2. homogénéité des variances conditionnelles : 
3. les distributions des variables sont gaussiennes. 


Nous allons reprendre en détail ces trois points. 


2.1. Indépendance stochastique des résultats d'observation 


Il s’agit de vérifier que les échantillons ont bien été prélevés au hasard. On doit s'assurer que 
l’observation de l'expérience n° i est bien indépendante de celles qui ont été effectuées auparavant 
et qu’elle n’influence pas non plus les observations suivantes. 

L'étude de l'indépendance stochastique des expériences évoquées dans les schémas typiques de 
l'analyse de corrélation-régression peut se ramener à l’étude de l’indépendance stochastique des 
séries de résidus {;}. Il importe de vérifier que l’échantillonnage n’a pas été dirigé. Désignons 
par %1,%2,%3,...,%n l'échantillon extrait de la population parente étudiée dans l’ordre où ils 
apparaissent. On propose plusieurs méthodes de vérification de l’indépendance stochastique des 
tirages. 


a — Test de la suite formée à partir de la médiane de l'échantillon — À partir de la suite des 
zj, on forme une autre suite y; constituée par l’ensemble des x; ordonné par valeurs croissantes. 
Cette nouvelle suite s'appelle suite variationnelle, et y; s’appelle l’ordre statistique de rang j. 
La valeur empirique de la médiane tea est l'élément central de la suite des y;, c’est-à-dire : 


Yn+1 si n est impair, 
2 


(vz + vry) /2 sin est pair. 


À partir de Péchantillon initial des zj, on va former une suite de deux caractères arbitraires, 
disons 0 et 1. Si la valeur de x4 est inférieure à £meq on place un 0, si-elle est supérieure on 
place un 1. On abandonne les éléments qui sont égaux à Zmed. 

L'idée du test repose sur les remarques suivantes : 

la suite de 0 et de 1 est constituée de sous-suites formées soit uniquement de 0 soit uniquement 
de 1. On désigne par u le nombre total de sous-suites. Il apparaît comme une question de bon 
sens que p doit avoir une valeur «pas trop faible comparée à n », car les sous-suites ne peuvent 
pas être trop longues si le tirage est dû au hasard. Il s’ensuit que la longueur À de la plus grande 
sous-suite doit avoir une valeur «pas trop grande comparée à n ». Il est clair que y et À sont 
des grandeurs qui dépendent de n et on les notera : u(n) et A(n). 

Si l'hypothèse d'indépendance statistique est vraie, on peut montrer que u(n) obéit à une loi 
normale dont la moyenne et l’écart type sont donnés par les expressions : 


Mlun) = 2 
Djy(n)] = 7 
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La distribution de A(n) est quelque peu plus compliquée, aussi préfère-t-on utiliser les résultats 
suivants (d’après S. Aïvazian) : 


un) > PE Lin +1) -1,96m 0 
A(n) < PE [3,3 (logio(n} + 1)] 


où PE définit l'opération troncature (partie entière). On rejettera l’hypothèse d'indépendance 
stochastique si l’une des inégalités n’est pas vérifiée avec moins de 10 chances sur cent de rejeter 
la loi d'indépendance à tort. 


b — Application à une suite de nombres pseudo-aléatoires — Le tableau 25.2 donne la 
hauteur d’un échantillon de 100 personnes prélevées au hasard parmi des conscrits. 


Tableau 25.2. 


1,725 1,69 1,73 1,663 1,727 1,705 1,717 1,72 1,716 1,692 
1,713 1,741 1,706 1,693 1,688 1,74 1,705 1,683 1,776 1,723 
1,706 1,715 1,746 1,714 1,727 1678 1,724 1,708 1,701 1,711 
1,702 1,685 1,698 1,734 1,729 1,719 1,701 1,713 1,702 1,708 
1,716 1,733 1,71 1,703 1,719 1,711 1,693 1,721 1,728 1,68 

1,711 1,704 1,696 1,744 1,694 1,723 1,748 1,704 1,781 1,676 
1,696 1,722 1,728 1,68 1,746 1,722 1,723 1,721 1,665 1,69 

1,735 1,724 1,7 1,686 1,722 1,723 1,682 1,736 1,708 1,692 
1,721 1,698 1,706 1,692 1,712 1,715 1,709 1,724 1,765 1,742 
1,663 1,736 1,719 1,701 1,716 1,679 1,707 1,726 1,687 1,709 


La lecture des données s’effectue ligne par ligne. On trouvera sur le Web (*) le programme 
teststat.c qui réalise ces simulations et ces calculs. Il s’agit donc de s’assurer du bien-fondé 
de l'indépendance stochastique du tirage. Nous avons trouvé £mea = 1,712, le nombre de sous- 
chaînes est 56 et la sous-chaîne la plus longue a la taille 6. Par ailleurs, on calcule : 


un) =40 et An) =9. 


On peut donc conclure qu’il n’y a aucune raison de repousser l'hypothèse d’un tirage au 
hasard. 


c — Test des suites ascendante et descendante — Ce test permet de déceler une tendance de 
déviation progressive de la moyenne de la distribution. 

Comme dans le cas précédent, on forme une suite de 0 et de 1 à partir de la suite donnée 
par l'échantillon initial. On compare chaque élément au suivant immédiat, s’il est plus grand on 
place un 0 et s’il est plus petit on place un 1. Le cas d'égalité est écarté. 

Ici encore la philosophie demeure la même et l’on comptera le nombre de sous-chaînes u(n) 
ainsi que la longueur de la sous-chaîne la plus grande À(n). D'un point de vue pratique on devra 


*http://www.edpsciences.com/guilpin/ 
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vérifier les inégalités suivantes : 


16n — 29 
u(n) > PE SR 1) - 1,96 ee 
90 
A(n) < Jo(n), 
Ao(n) étant donné par le tableau : 


n n < 26 26 < n < 153 153 <n < 1170 
Jo(n) 5 6 7 


Si l’une des deux inégalités n’est pas vérifiée, on rejettera l’hypothèse d'indépendance 
stochastique avec moins de 10 chances sur cent de rejeter la loi d'indépendance à tort. 


d — Application à une suite de nombres pseudo-aléatoires — On analyse le même échantillon 
(Tab. 25.2, page précédente) à la lueur de ce nouveau test. On obtient pour le nombre de sous- 
chaînes la valeur 67 et pour la sous-chaîne la plus longue la valeur 3. Le calcul donne u(n) = 58 
et le tableau A(n) = 6. Ici encore rien ne permet de repousser l’hypothèse d’un tirage au hasard. 


e — Test des carrés des différences successives — Ce test ne concerne que les données qui 
obéissent à une distribution normale. Toujours à partir de la suite initiale, on forme la demi- 


somme de la moyenne des carrés des différences entre chacun des éléments et son suivant 
immédiat, soit : 


@ (n) = TA m Xn-1) 4 i Tk+1 — 


on calcule également la variance empirique de l'échantillon : 


1 n 
2 
o (n) = —— Tk- T 
M= 5 
k=1 
où xo est la moyenne de xj. On mesure la «déviation éventuelle » au moyen de la grandeur : 


_ Én) 
y(n) i a?(n) 


il s’agit en fait de la demi-moyenne des carrés des écarts ramenée à l'écart type. 

Pour un échantillon de taille supérieure à 20, on rejettera l'hypothèse de l'indépendance 
stochastique des tirages si y(n) < Ja(n). Ya(n) est directement relié à la loi normale et l’on 
montre que l’on a : 


Ua 
n + 0,5(1 + u2) 


Ya(n) =1+ 


où Ua est le quantile d’ordre a de la loi normale réduite. On rappelle la définition du quantile 
d'ordre à : 


P(z < ua) =Q, 
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soit si à = 0,05 , on trouve dans les tables : 


le quantile d'ordre 0,05 est —1,65. 


Remarque : Il ne faut pas confondre le quantile d'ordre a avec le point de pourcentage 100 Q. 
Le point de pourcentage 100 Q de la variable aléatoire £ est la valeur wq telle que P(x > w,) = 
1— F(w,) = Q où F(z) est la répartition de la variable aléatoire £. 


f — Application à une suite de nombres pseudo-aléatoires — Toujours sur le même exemple, 
on examine ce que donne le test. On obtient q°(n) = 0,000 59 et o?(n) = 0,000 48 puis : 


y(n) =1,228 et  Yo,05(n) = 0,837. 
Encore une fois il n’y a pas de raison d'abandonner l'hypothèse d’un tirage au hasard. 


2.2. Homogénéité des variances conditionnelles 


La variance conditionnelle Dfn|x] de la variable dépendante doit rester inchangée, au sens 
statistique, quand x varie. Autrement dit, D[n|x] doit être une constante : 


D{n|x] = o? = cte. 


Si tel n’est pas le cas, elle doit être proportionnelle à une fonction connue de x, notée h?(x) 
(car D est une forme quadratique), qui sera déterminée empiriquement : 


Dinz] = o?h?(x). 


Le problème qui nous préoccupe maintenant, c’est de connaître un test qui nous permette de 
juger de l’homogénéité ou non de la série des variances. 

On suppose que les variables ont été regroupées dans k intervalles. Soit ro; le milieu de chacun 
des intervalles, la variance empirique de chaque intervalle est donnée par l'expression : 


LE , 
si = DC >. PAN 
i=l 


m;— 1 


où m; est le nombre d'éléments tombant dans l'intervalle de regroupement i et ÿ; la moyenne 
de y dans le même intervalle. 

Il s’agit de vérifier que les différences entre les k valeurs obtenues pour les s? sont dues au 
hasard ou, dans le cas contraire, si Pon doit envisager une tendance systématique à varier en 
fonction de x. Quand D{y|x] est une constante, alors : : 


D{ylroi] = D[ylzo2] =... = D{yltox] = 0°, 


et la variable aléatoire : 
k 
1 s? 
A = —— il + 
z 2 Mi lOBe (2) 
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suit approximativement pour m; > 2 une loi du y? à k — 1 degrés de liberté; dans expression, 
on a noté : 


k 
1 
et s— 7 > (mi — 1)s?, 


n étant la taille de l'échantillon. 

On rejettera l'hypothèse de l'indépendance de la suite des variances si la valeur empirique 
de À tombe dans le domaine des valeurs peu probables de la variable aléatoire. Il faudra alors 
trouver une fonction h?(x). 


Exemples 


1. Le tableau 25.3 donne les résultats d’une première expérience qui à été réalisée 10 fois pour 
cinq valeurs de la variable x qui sont : 5, 10, 17, 22 et 27. La onzième ligne donne la moyenne 
obtenue pour chaque valeur de z, la douzième la variance et la treizième les valeurs de x. 

Tous calculs faits, on trouve la valeur À = 5,12. Le nombre de degrés de liberté est 5—1 = 4, 
et la probabilité de dépasser la valeur A est 0,275. On peut affirmer qu’il n’y a aucune raison 
pour repousser l'hypothèse de l’homogénéité des variances conditionnelles. 


Tableau 25.3. 


Yi Va U35 Uaj Ysi 

0 125,8 148,71 182,53 211,92 239,61 

1 134,19 151,39 177,44 217,01 229,10 

2 123,87 160,73 181,26 210,08 241,02 

3 119,82 151,21 192,15 207,93 220,77 

4 118,46 155,23 190,81 212,80 240,19 

5 133,87 140,27 187,63 210,39 233,52 

6 123,51 154,06 182,36 205,00 237,15 

7 116,95 149,36 185,76 213,24 238,11 

8 144,81 147,22 182,49 215,28 236,93 

9 128,99 150,36 184,29 201,03 229,74 

Moyenne 127,03 150,86 184,67 210,47 234,61 

Variance 74,31 28,87 20,26 22,98 40,89 
Valeur de X 5 10 17 22 27 


Remarque : Les calculs ont été exécutés avec 16 chiffres significatifs, mais nous n’en avons 
reportés que 5, les nombres ayant été arrondis. 


Sur le Web E), on trouvera le programme varian_1.c qui réalise cette simulation. 
2. Le tableau 25.4, page ci-contre, donne les résultats d’une deuxième expérience qui a été 
réalisée 10 fois pour cinq valeurs de la variable x qui sont : 70, 80, 115, 176 et 212. 


* http://www.edpsciences.com/guilpin/ 
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Tableau 25.4. 


Vi U2j U3j Vaj Ysi 
0 148,2 138,7 109,5 75,91 72,77 
1 155,8 141,5 100,7 96,89 0,33 
2 146,5 151,2 107,3 68,32 82,47 
3 142,8 141,3 126,1 59,47 —57,01 
4 141,6 145,5 123,8 79,55 76,75 
5 155,5 129,8 118,3 69,59 30,85 
6 146,1 144,2 109,2 47,4 55,81 
7 140,2 139,3 115,1 81,36 62,44 
8 165,4 137,1 109,4 89,73 54,27 
9 151,1 140,4 112,5 31,05 4,76 
Moyenne 149,3 140,9 113,2 69,93 38,34 
Variance 61,01 31,54 60,18 389,9 10941,0 
Valeur de X 70,0 80,0 115,0 176,0 212,0 


Le calcul de A donne 50,57. Il y a environ deux chances sur 10!° de pouvoir dépasser cette 
valeur. On renonce donc à l'hypothèse de Phomogénéité des variances conditionnelles et l’on va 
chercher une loi k?(x) qui rende les variances homogènes. On essaye la loi h?(x) = exp(r/39,0) 
et l’on recommence les calculs. On trouve alors : À = 4,516 et la probabilité de dépasser 
cette valeur est P = 0,211. Rappelons que l’on a perdu un degré de liberté en choisissant 
R?(x) = exp(x/39,0) et donc il convient de calculer une valeur du x? à k —2 degrés de liberté. 
À présent, il n’y a aucune raison de rejeter l'hypothèse d’une variation exponentielle des 
variances, les données expérimentales ne la contredisant pas. 


Sur le Web E), on donne le programme varian_2.c qui réalise cette simulation. 


2.3. Les distributions sont gaussiennes 


Il faut vérifier le caractère gaussien des y;; pour chaque valeur fixée de i. C’est le critère du x? 
qui sera le plus souvent utile, quoique l’aplatissement et la dissymétrie rendent également de 
grands services. 


3. Conclusions 


Nous avons évoqué les conditions idéales d'application de la méthode des moindres carrés que 
nous avons déjà présentée au chapitre 4 à propos de l’interpolation. En pratique les trois critères 
ne sont pas toujours vérifiés simultanément, mais ce n’est pas pour cela que l’on va renoncer 
aux méthodes d'analyse de corrélation-régression et en particulier à la méthode des moindres 
carrés. 

Il a été montré notamment que l’estimation des coefficients de corrélation par la méthode des 
moindres carrés conserve toutes les bonnes propriétés à condition que n soit grand devant 1, 
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même si la variable dépendante n’est pas distribuée normalement à condition toutefois que les 
erreurs de mesure soient indépendantes. On dit alors que la méthode des moindres carrés est 
robuste. 
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26 | Analyse de corrélation 
et de régression 


1. La corrélation 


Dans le chapitre précédent, nous avons vu que deux variables aléatoires pouvaient avoir une 
certaine tendance à varier simultanément. La visualisation des données sur un graphique aide 
fortement à caractériser une éventuelle dépendance ; c’est la dépendance linéaire qui donne toute 
sa puissance à l’analyse de corrélation. Avant de s’attaquer à la détermination des paramètres de 
la liaison de corrélation, il convient de s’assurer de l’existence effective d’une telle dépendance, 
et c’est l’étude du coefficient de corrélation qui permet de répondre à la question. 


1.1. Calcul du coefficient de corrélation dans le cas où les variances conditionnelles 
sont homogènes 


Le calcul du coefficient de corrélation et son interprétation ne fonctionnent correctement que 
dans le cas d’une dépendance linéaire entre les variables aléatoires. Si une telle dépendance ne 
peut être envisagée, c’est au rapport de corrélation que nous aurons affaire. Pour l'instant, on 
suppose que l’on a établi le caractère linéaire de la dépendance entre les deux variables aléatoires 
n et €. Ainsi le coefficient de corrélation est défini par l’expression : 


… — MAE- MIE) - (n - Min}, 
K VD [ED Ni 


La valeur empirique ou estimateur est donnée par les expressions : 


ie 7 E 
"n DG — Z)(yi — 3) 
Try = E ; 


OrOy 


soit encore : 
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où : 


1 n 1 k 
aoua Le 0 
Fe ner) mat 
i=1 i=1 
k 
__ 1 1 i 
z n= h m 
i=1 i=1l 
Ve j 
0 = es > (x —&) = : X mila} — 4) 
i=1 i=1 


1 n 
2 == , —\2 
g= > (ui — 9)”, 


expressions dans lesquelles m; est le nombre d’éléments dans l'intervalle à, et z? est le milieu 
(centre) de l'intervalle 1. 

Nous verrons en appendice de quelle manière ces expressions sont transformées lorsque les 
variances conditionnelles ne sont pas homogènes. Quoi qu'il en soit, Fey est un coefficient 
calculable pour un système quelconque de deux variables aléatoires et sa valeur est comprise 
entre —1 et +1. 

Dans le cas où les distributions des variables 7 et £ sont gaussiennes, le coefficient de 
corrélation admet une signification concrète en tant que caractéristique de l'intensité de liaison 
entre les variables. Ainsi : 


e 
|i 


1. |Fzy| = 1 confirme une dépendance fonctionnelle linéaire, il n’y a pas d’aspect statistique, 

2. Tey = 0 montre la complète indépendance des variables. 

3. Les deux moyennes, les deux variances et le coefficient de corrélation donnent une information 
exhaustive sur la dépendance stochastique des variables étudiées. 


Dans le cas où les distributions des variables 7 et £ ne sont pas gaussiennes, le coefficient de 
corrélation ne peut être adopté que comme l’une des caractéristiques possibles de l'intensité de 
la liaison. Il s'ensuit que l'interprétation n’est pas sûre, et notamment : 

1. sy = 0 ne signifie plus l'indépendance, 
2. [Fry| = 1 ne signifie pas nécessairement la dépendance linéaire. 


Remarque : Une dépendance étroite entre deux variables aléatoires ne signifie en aucune 
sorte une interdépendance causale. Il y a une corrélation étroite entre l'arrêt des voitures et 
l'apparition d’un feu rouge. Si l’on se place du point de vue du physicien le feu rouge n’est 
pas une cause qui arrête véritablement les automobiles. Si l’on se place du point de vue du 
juriste la corrélation entre, non plus l’arrêt du véhicule mais le comportement du chauffeur, et 
l’apparition du feu rouge est une causalité à caractère juridique. Autrement dit la corrélation 
entre le véhicule et le feu rouge est factice, tandis qu’elle ne l’est pas entre le chauffeur et le feu 
rouge. 


1.2. Distribution empirique du coefficient de corrélation 


Le but de ce paragraphe est d'établir le bien-fondé d’une liaison de corrélation. Dans le cas où 
les distributions des variables sont normales et où la taille n de l'échantillon est grande devant 
l'unité, on peut alors montrer que la distribution de F,,, est normale en première approximation, 
sa moyenne étant r et sa variance donnée par l'expression : 


Ga) 


2 
o 
r n—1 
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Il faut noter que cette approximation devient très grossière pour n prenant des valeurs de 
quelques unités ou pour r voisin de 1 en valeur absolue. 

Cette approximation par une distribution normale nous permet de tester l'hypothèse d’une 
absence de liaison de corrélation, soit r = 0. Si r = 0, la grandeur 


suit une loi de Student à (n — 2) degrés de liberté. 

On cherche dans la table de la loi de Student la valeur ta(n — 2) du point de pourcentage a 
qui est le seuil de signification que l’on choisit usuellement égal à 0,05. 

Si w < ta(n — 2), on rejette alors l’hypothèse d’une liaison de corrélation avec la probabilité 
a de la rejeter à tort. 


Intervalle de confiance pour la vraie valeur du coefficient de corrélation — On utilise le fait 
que la distribution de r est normale. On évalue les limites du domaine au moyen des relations : 


Fay(l — 72) 1-7, 


tn et 


Ua/2 est le point de pourcentage 100a/2 de la distribution normale réduite. Il en résulte que r 
appartient à cet intervalle avec un niveau de confiance {1 — œ) à condition toutefois que r ne 
soit pas trop près de 1 et que n soit suffisamment grand (plusieurs dizaines). 


1.3. Cas d’une dépendance non linéaire, rapport de corrélation dans le cas où les variances 
conditionnelles sont homogènes 


Dans le cas où la dépendance s'écarte notablement de la forme linéaire, le coefficient de 
corrélation perd son sens en tant que caractéristique de l’intensité de liaison entre les deux 
variables aléatoires. On utilise alors le rapport de corrélation p,/£ qui est beaucoup plus sûr 
parce que son interprétation ne dépend pas de la forme de la dépendance de la régression 
étudiée. Le rapport de corrélation est donné par l'expression : 


1 À 
=X miji - 9) 2 
2 i=1 _ 5ÿ 
Pre k mi A 
z2 2 9) 
i=l j=1 
avec 
; k 
_ 1 — 1 
p =— Y y; g=- mi 
Mi n 
j=1 i=1 
s exprime la dispersion des moyennes partielles ÿ; autour de la moyenne globale ÿ, et s mesure 


la dispersion des résultats individuels autour de la moyenne globale y. 
Contrairement au coefficient de corrélation, les rapports de corrélation p,/£ et Pejy ne sont 
pas symétriques, en revanche, les propriétés de r et de p sont très semblables : 


1. Ø est compris entre —1 et +1. 
2. Si |o] = 1, il existe une dépendance fonctionnelle univoque entre 7 et € et réciproquement. 
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3. L’absence d’une liaison de corrélation entre 7 et € signifie que pp; = 0. Réciproquement, 
Si Pne = 0, alors y; = ÿ. Les moyennes ÿ; ne dépendent pas de x, autrement dit la droite 
correspondante de régression est parallèle à l’axe horizontal. 


Remarque : Il n’y a pas de dépendance simple entre 9,/£ et Pejn, et la non-corrélation de n et 
£ ne signifie pas nécessairement la non-corrélation de £ et n. 


Absence d'une liaison de corrélation — Tout comme le coefficient de corrélation, 2 Je Suit une 
loi normale pourvu que n soit au moins de l’ordre de quelques dizaines. 
Ici encore, dans le cas où : 


on cherche dans la table de la loi de Student la valeur t,(n — 2) du point de pourcentage a qui 
est le seuil de signification. 

Si l’on est amené à rejeter l’hypothèse d’une liaison de corrélation, on le fait avec la 
probabilité a de la rejeter à tort. Dans le cas contraire, cela veut dire que la liaison étudiée est 
statistiquement significative. 


Remarque : Il est possible de montrer que le rapport de corrélation ne peut être inférieur à la 
valeur absolue du coefficient de corrélation r. Dans le cas d’une dépendance linéaire, les deux 
caractéristiques coïncident et, par conséquent, la différence 5? ET Tay est une mesure de l'écart 
de la dépendance de régression par rapport à la forme linéaire. 


1.4. Cas où les variances conditionnelles ne sont pas homogènes 


On suppose alors que l’on a trouvé les deux fonctions h?(x) et g?(y) qui rendent homogènes les 
variances conditionnelles : 


Din = z] = oh’ (2) et  D[éln = y] = oËg”(y). 
On pose alors : 


WR et Wgi = -rn 


Ra) g(yi) 


n n 
W;=S uw et W=} wg 
i=1 i=1 


où z; et y; sont les centres des intervalles de regroupement respectivement pour x et pour y. 
Dans ces conditions, on a une autre expression du coefficient de corrélation : 


7 ñ 1/2 
(mon) (ne) 
nn RTiYi — [— giTiYÿi — 
m Wt Wii 
: = 1/2 


Try = 
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avec 1 À 1 
Z= y Dur: et g= X wry 
fi fi 
1 m n 
s? WW, W(Ti — z)? et s= o7 DDC y) 
i=l f iz 
1 Š 1 Š 
T = wW D ah et y= W, DE 


Les relations surmontées d’une barre sont obtenues avec les valeurs de h?(x;) tandis que celles 
surmontées d’une double barre sont obtenues avec les valeurs de g°(y;). 


Remarque : Le signe de F doit coïncider avec le signe des facteurs sous le radical (les signes des 
expressions situées entre les accolades sont les mêmes). 


D'une façon semblable, le rapport de corrélation prend la forme suivante : 


k 
bD wpmi(gi — 7)? 
i=1 


2 en 
Pnt 5 k 


a 
Du DC — 3) 
i=1 j=1 


2. Régression linéaire 


L'analyse de corrélation nous a montré que deux variables aléatoires sont liées. Maintenant, il 
s’agit de déterminer la forme générale de la liaison étudiée, puis d’estimer les paramètres entrant 
dans l’expression analytique de la liaison. Les seuls renseignements dont nous disposons sont les 
données expérimentales. f 

Il n’y a pas de méthode standard pour obtenir la forme analytique de la liaison, cependant, 
la connaissance de la nature du problème est utile pour orienter les choix adéquats. Il convient 
d’ajouter que les fonctions à partir desquelles la liaison entre les variables est décrite doivent 
être linéaires par rapport aux paramètres à déterminer. Dans le cas où la dépendance n’est pas 
linéaire, il s'agira alors de décrire une dépendance curviligne et l’on utilisera une parabole de 
degré peu élevé. | 

Pour ce qui concerne l'estimation des paramètres, elle sera obtenue en règle générale par la 
méthode de moindres carrés à partir des données expérimentales. C’est pour cette raison que 
l’on demande la linéarité des fonctions par rapport aux paramètres à déterminer : la dérivation 
de la forme quadratique (définie positive) par rapport à chacun des paramètres à déterminer 
nous conduit à l'obtention d’un système linéaire que nous savons résoudre. 


2.1. Calcul des paramètres par la méthode des moindres carrés 


On suppose que nous avons vérifié sur les variables aléatoires x et y un certain nombre de 
propriétés qui sont les suivantes : 


1. il existe entre les variables une liaison du type de celles que nous avons évoquées au chapitre 
précédent ; 
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2. les variables sont gaussiennes et les résultats d'observation sont bien dus au hasard ; 

3. la variance de la variable dépendante satisfait soit à l’homogénéité des variances condi- 
tionnelles D[nlé] = o, soit à une certaine loi h?(x) qui rend les variances conditionnelles 
homogènes D{n|x] = a?h?(x) ; 

4. la liaison étudiée est statistiquement significative, c’est-à-dire que la valeur du coefficient 
de corrélation ou du rapport de corrélation est suffisamment éloignée de zéro pour que 
l’hypothèse d’une absence de liaison de corrélation ne puisse pas raisonnablement s'expliquer 
par des fluctuations dues au hasard ; 

5. la forme de la régression est linéaire du type Y = aX +b'. Si cela n’est pas le cas, on transforme 
la variable de telle sorte qu’on trouve une forme linéaire. 


En définitive, il convient d’obtenir des estimateurs de a et b’. Il faut bien comprendre qu’il 
s’agit effectivement d’estimateurs car ces valeurs dépendent de l’échantillon. 


2.2. Méthode des moindres carrés 


Pour déterminer la droite empirique de régression, on minimise la somme des carrés des résidus 
c'est-à-dire la variance empirique s? des données expérimentales par rapport à cette droite, soit : 


n 


$? = Z >_b -Y (x) = > > bi — āz; — PT 


ns 
i=1 
Le 
où 3 = = >> wi — àx — b'}? 
i=1 j=1 
t wi =- : 
et wi x) 


Calcul de la droite de régression — Notons d’abord qu’il est plus habile d’effectuer les calculs 
de la droite par rapport au barycentre des abscisses qui n’est rien d’autre que la moyenne de x. 
On écrira donc la loi sous la forme : 


Ÿ = à(x — x) +b, 
1 n 
avec z=-% Li. 
n 
i=1 


Cette remarque n’est pas une coquetterie, non seulement les calculs se retrouvent beaucoup plus 
aisément par ce procédé mais à et b s'avèrent être des variables (estimateurs) stochastiquement 
indépendantes à la différence des variables (estimateurs) à et b’. 

Si on dérive l'expression de s? par rapport à à et b et qu’on annule les dérivées, on obtient 
alors : 


et 
n k 
X yizri- nīg XO miga? -nag 
a= =! : i=1 - Z F4, 
nsi nsi Sx 
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avec 


n 


z= Z Ja 


i=1 


Dans le cas où D{n|£] = o?°h? (x), on obtient un autre jeu d'expressions : 


avec 


et 
n k k 
ee 20 Que 
y WiYiLi — TyW J WiMiYiTi — TY y WiMi 
i=1 cn AS i=1 | 
n E k 
12 z 
X wir: — z] X wim;lz? — z? 
i=1 i=1 


a = 


On remarquera que b n’est plus simplement relié au coefficient de corrélation comme dans le 
cas d’une variance constante. 


2.3. Estimation de la précision 


a — Sur les paramètres ā et b — Il s’agit de déterminer les intervalles de confiance pour la 
ligne de régression inconnue à partir de l’expression de la droite estimée : 


Ÿ = à(x — à) +b, 


alors que la droite Y = a(x — Z) + b est inconnue. 

La distribution de Student à (n — 2) degrés de liberté permet de résoudre le problème qui 
consiste donc à déterminer la précision sur les coefficients a et b. On calcule pour ce faire les 
quantités suivantes : 


do 


Li k 2 1 ar. a 
= t 2g i — Y (zi 
z Dis e s z > [y (x )] 
à la suite de quoi, nous pouvons affirmer oe : 

= S = 
1. b — taja(n A a ee 
2.a-t, 2 <a<üa+tapo(n —2 

a j2(n Pa Vn a a 72{ }—= LR 


avec la probabilité (1 — œ) de tomber dans 
chacun de ces intervalles. 


Sur le Web C), on trouvera le programme regres.c qui calcule l'incertitude sur la pente de 
la droite de régression. 


* http://www .edpsciences .com/guilpin/ 
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b — Pour une valeur donnée xo de la variable x — On peut montrer que la variable : 


LG) -Y GIVE 
Fe 


2 
Sr 


z(x) 


suit pour toute valeur fixée de x la distribution de Student à (n — 2) degrés de liberté. 
La différence entre la valeur moyenne empirique Y (xo) et la valeur théorique Y (zo) ne dépasse 
pas en valeur absolue la grandeur : 


— F2 
ta(n -2 1, 


vn Sz 


c — Cas des variances conditionnelles non homogènes -— Il est bien entendu que toutes les 
formules de ce paragraphe doivent être modifiées au cas où les variances conditionnelles ne sont 
pas constantes. Les expressions prennent alors la forme suivante : 


A E E E E 


< 1 ay 
3. Y(x) € | F(zo) E ta(n- 2)5 | z+ (æ z) 
X wi(zi — 2)? 
il 
avec 
k. 
=) D uw; — az? — b)? 
i=1 j=1 
_ 1 
et Z— Witi 


2.4. Régression multilinéaire, estimation de la précision 


A la fin du chapitre concernant l’interpolation, nous avons étudié les systèmes linéaires surdé- 
terminés qui s’écrivent : 


m 
X aksk + ax =0, 
k=0 
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pour l = 0, 1,2,...,n. Soit en notation matricielle : 
AX =b, (26.1) 


A étant une matrice de n lignes et de m colonnes (avec m < n). Le système des équations 
normales associé au système surdéterminé s’écrit alors : 


[ATA]X = [AT]b, (26.2) 


expression dans laquelle AT est la matrice transposée de la matrice A. Il est intéressant de pou- 
voir estimer les incertitudes qui entachent les résultats obtenus. La résolution du système (26.2) 
fournit une solution que l’on note (£o, £1, £2,- .-, ém) et l’on désire obtenir les valeurs de la 
dispersion gą sur chacune des valeurs é. Pour cela on calcule d’abord la dispersion ø sur les 
valeurs des seconds membres, on l’obtient en calculant d’abord la somme des carrés des résidus : 


n m 2 
ms] angi tarl , 


1=0 Lk=0 
c est donné par l’expression suivante : 
R 
ym-n 


Désignons par dx les éléments de la matrice D = [AT A]-1 (inverse de la matrice des équations 
normales). Alors la dispersion oz sur chacune des valeurs x est donnée par l'expression : 


Ok — OV dkk- 
Il est aisé d’obtenir la matrice de corrélation Tgp entre les variables x, et £p : 
ne dap | 
a = oy 
y dqqdpp 


Le programme surdeter.c mentionné à la fin du chapitre 6 sur l’interpolation s’occupe de 
calculer la matrice de corrélation et les incertitudes sur les valeurs calculées des inconnues; le 
détail des calculs se trouve dans l’ouvrage de H. Mineur cité en bibliographie. 


TO = 


Remarque : Si le coefficient de corrélation entre deux variables est proche de l’unité (hormis 
les éléments de la diagonale), cela signifie qu'il faut supprimer dans le modèle l’une des deux 
variables. 
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À |Les suites de Sturm. 
Application à la détermination 
du nombre de racines réelles 
d'un polynôme 


En 1829, le mathématicien Charles Sturm (1803-1855) fait paraître un mémoire, célèbre alors, 
consacré à la détermination du nombre de racines réelles d’une équation f(x) = 0. L'intérêt 
est avant tout théorique, et, comme on s’en apercevra au cours des applications pratiques, 
les suites de Sturm ne sont pas d’un emploi aussi aisé qu’une première impression pourrait le 
laisser supposer dans la mesure où leur usage impose une très grande précision dans les calculs 
numériques. L'introduction des erreurs d’arrondi à chaque étape des calculs conduit d’une façon 
quasi inexorable à des résultats aberrants. Ceci explique la limitation des suites de Sturm au 
cas des polynômes de degré assez faible (quelques unités) à coefficients entiers. 


1. Notion de variations d’une suite numérique 


Considérons une suite numérique quelconque finie ou infinie notée ao, @1,@2,...,ax,... On dit 
qu'il existe une variation dans cette suite lorsque deux termes consécutifs possèdent des signes 
opposés. Autrement dit, il existe une variation lorsque le produit de deux termes consécutifs est 
négatif. Par exemple, considérons la suite finie suivante : 15, 12, —8, —7, 18, —15, —12, —4, 7,9. 

Cette suite possède quatre variations ou quatre changements de signe. C’est sur cette notion 
de variations dans une suite que repose le théorème de Sturm. 


2. Suite de Sturm générée à partir d’un polynôme 


Soit un polynôme de degré n, à coefficients réels, que l’on note P,(x). À partir de P,(x), on 
génère une suite de polynômes Q;(x) définie ainsi : on pose Qo(x) = Pa(x) et Q1(x) = P}(x), 
P! (x) étant le polynôme dérivé de P,(x) par rapport à x. Ensuite, on divise Qo(x) par Qı (£). 
On obtient alors : 


Qo(x) = (aox + bo)Q1(x) + Rn-2(x), 


expression dans laquelle on à désigné par R;-_2(x) le reste de la division, c'est au plus un 
polynôme de degré (n — 2). On pose alors : 


Q2 (x) = —Rn-2(7). 
On opère de la même façon en divisant Qı (z) par Q2(x), ce qui s'écrit : 


Qı (2) = (aix + b1)Q2(2) + Rn-3(2), 
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le reste de la division R,_3(x) étant un polynôme de degré est au plus (n — 3). À nouveau, 
on pose Q3(x) = —Rh-_3(x). Nous allons poursuivre les mêmes opérations jusqu’à ce que nous 
parvenions au terme ultime de la suite : 


Qn(x) re —Ro(x), 


où Ro(x) est alors une constante. La suite des Q;(x) s’appelle suite de Sturm. Pour des raisons 
de concision d'écriture, on peut désigner par m; la quantité (ajx +b;), et l’on obtient la relation 
de récurrence entre trois polynômes consécutifs : 


Qr(x) = Mk (2) — Qk+2(2), 


avec les deux premiers polynômes de la suite : Qo(x) et Q1(x). 


3. Quelques propriétés des suites de Sturm 


D'abord, nous allons supposer que le polynôme P,(x) ne possède aucune racine multiple, 
autrement dit, Qo(x) et Q1(x) n’ont aucune racine commune. Sous cette hypothèse, on déduit 
les propriétés suivantes : 


a. QA(æx) est une constante différente de zéro. En effet, Q,(æx) est le plus grand commun diviseur 
de Qo(x) et de Qi(x), et si Q,(x) est égal à zéro cela signifie que Qo(x) et Q:(x) ont au 
moins une racine commune ce qui est contraire à l'hypothèse. 

b. Deux polynômes consécutifs Q(x) et Qzx+1(x) ne possèdent aucune racine commune. En 
effet, la relation de récurrence montre que, s’il n’en était pas ainsi, Qx+2(x) s’annulerait aussi 
et ainsi de suite jusqu’à Q,(x) qui serait nul; mais nous venons d'établir au paragraphe 
précédent que cela n’était pas possible. 

c. Si, pour une valeur z = 7 de la variable, le polynôme Q(z) s’annule, la relation de récurrence 
nous donne : 


Qx(n) = —Qxsan) ou encore Qx(n) : Qr+a(n) < 0. 


d. Lorsque Qo(x) s’annule pour la valeur x = €, le rapport Qo(x)/Qi(x) passe du négatif au 
positif quand x passe par € par valeurs croissantes. Ceci n’est vrai qu’au voisinage immédiat 
de la racine de Qo(x) dans un domaine où Q:1(x) garde un signe constant — on rappelle que 
Qo(x) et Q1(x) n'ont pas de racine commune. 


Comme par hypothèse £ est une racine simple, nous pouvons écrire : 
Qo(x) = (x — É)(an-1 + an-2(£ — E) +...) 


À ce propos, signalons qu’on peut toujours écrire la deuxième parenthèse du deuxième membre 
sous forme d’un polynôme I, _1(x}) de degré (n — 1) : 


TTh_1(x) = Cn + Cn-1E + Cn—27° ET CE à 


Le changement de variable x en x — E permet d'écrire : 


n—1l 
In-1(2) = an1 + X anple — £). 
k=1 
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D'un autre côté, on peut écrire Q1(x) sous la forme : 
Qi(x) = an-1 + 2an_o(r — E) + 3an_3(x — E)? +... + (n — IJa (z — €). 


Dans le voisinage immédiat de la racine €, c'est-à-dire dans le domaine (£ — e2,£ — £?) où 
Q1(x) n’a pas de racine, on peut écrire : 


Qo(x) Den ni 
Qu) CSS e 
les signes sont donnés ci-dessous : 
LES E r-e? 
Qo(x) - 
Q1(x) ù i 


Il s'ensuit que Qo(x) et Q1(x) ont leurs zéros entrelacés. À présent, il nous faut envisager le 
cas des racines multiples. À partir d’un certain rang, noté (p + 1), qui ne dépend que de l’ordre 
de multiplicité des racines, la suite des polynômes devient identiquement nulle. Le polynôme 
Q,{x) est alors le PGCD de Qo(x) et Q1(x). Si l’on pose : 


. _ Q(z) 
í Qp(zx) 


alors la nouvelle suite Qi(x), QT, Q5,...Q est une suite de Sturm, et le polynôme Q5 n’a plus 
que des racines simples. Ainsi s’est-on ramené au cas précédent. 


Q 


4. Le théorème de Sturm (1829) 


Soient a et b deux nombres réels tels que a < b. Le nombre N de racines réelles du polynôme 
PA(x) à coefficients réels et de degré n, qui sont comprises entre a et b, est égal à la différence 
des variations prises par la suite de Sturm {Q;(x})} aux points a et b : N = Na) — N(b), où 
N (y) désigne le nombre de variations de la suite de Sturm {Q;(x)}. 


Démonstration 


Pour parvenir à nos fins, nous allons faire croître la variable x depuis la valeur a jusqu’à la 
valeur b. Chaque fois que l’on passe par une racine £ de Q(z), les signes des deux polynômes 
voisins Qz_1(r) et Qx+1(x) sont conservés et demeurent, bien sûr, opposés. Que le signe de 
Qx-1(x) change ou non, le nombre de variations de la suite partielle Q4_1(x), Qx(x) et Qx+1(x) 
ne change pas. Donc, d’une façon générale, le fait de passer par une racine d’un polynôme Q4(x) 
ne change pas le nombre de variations de la suite excepté si k = 0. En effet, dans ce dernier 
cas, au passage de chaque racine de Qo(x), le rapport Qo(x)/Q1(x) passe du négatif au positif 
pour les x croissants et l’on perd alors une variation. Il est évident qu'une racine multiple n’est 
comptée que comme racine unique, et il est indispensable d'examiner en détail la suite des Q;(x). 
D'un point de vue pratique, le nombre total de racines réelles est donné par : 


Dans ce cas, seul le coefficient du degré le plus élevé de chaque polynôme Q;(x) est utile pour 
calculer N4. 
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Le nombre de racines positives est donné par : 
N = N(0) — N(+oo). 


Il faut, pour calculer N3, connaître les coefficients des termes de degré zéro dans chacun des 
polynômes (il s’agit de la constante). Nous pouvons donc en déduire que, pour qu’un polynôme 
de degré n possède n racines réelles, il faut que les coefficients de degré le plus élevé soient 
positifs pour chacun des polynômes de la suite de Sturm. Par ailleurs, pour qu’un polynôme 
n'ait que des racines positives, il faut en plus que les termes de degré zéro aient des signes 
alternés. Insistons sur le fait que le théorème de Sturm peut se révéler très efficace pour localiser 
une racine ou pour vérifier qu'il existe ou non une racine dans un domaine choisi à avance (fini 
ou infini). 


5. Disposition des calculs, schéma de Routh (1831-1907) 


Le but de cet algorithme (1905) est avant tout d'éviter les nombres fractionnaires résultant de 
la division de deux polynômes consécutifs. À cette fin, il suffit de multiplier tous les coefficients 
du dividende et tous les coefficients du diviseur par deux nombres tels que le reste et le quotient 
n'aient pas de nombres fractionnaires comme coefficients. On dispose sur deux rangées les 
coefficients de Qo(x) et de Q1 (x) selon les puissances décroissantes. 


Go 1 Q2 Q3 Q4 ... ŒAn-1 An 
bo bi bo b3 ba sie bn—1 bn. 


On calcule une troisième rangée de termes appelés c; possédant (n — 1) termes et que l’on 
exprime facilement à partir des a; et des bj au moyen de la relation : 


Cj—1 7 boa; = aob; avec j i E 


Cette ligne correspond au reste partiel de la division de Qo(x) et Q1(x), on obtient le reste 
définitif en calculant une quatrième rangée de termes d; exprimée au moyen d’une combinaison 
linéaire des b; et des c; : 

dj-1 = Cob; = Boc;. 


La rangée des dx est donc l’ensemble des coefficients, disposés selon les puissances décrois- 
santes, du polynôme Q2(x). On recommence rigoureusement les mêmes opérations en utilisant 
les polynômes Q:(x) et Q(x); on poursuit jusqu’à parvenir à Q,(x). 


6. Quelques exemples de suites de Sturm 


Chaque suite de polynômes orthogonaux constitue une suite de Sturm. L'étude des zéros de ces 
polynômes peut être envisagée par ce moyen. 


7. Mise en œuvre du théorème de Sturm 


Sur le Web 32 nous proposons le programme sturm.c qui dénombre les racines réelles d’un 
polynôme quelconque à coefficients réels. Afin de limiter la taille très rapidement croissante des 
nombres calculés par la méthode de Routh, à chaque calcul de la suite des dj, nous effectuons 
la recherche du PGCD de tous les nombres d;, puis, le cas échéant, nous procédons à la 
simplification, c’est-à-dire à la division par le PGCD. 


* http://wwu.edpsciences.com/guilpin/ 
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7.1. Exemple 1 


Voici les coefficients dans l’ordre des puissances décroissantes d’un polynôme de degré 4. 
ao = 1 ai = —5 a2 = 10 a3 = —10 Q4 = 4. 


Ce polynôme admet deux racines réelles qui ont pour valeur 1 et 2, et deux racines complexes 
conjuguées 1 +. Le programme donne : 
nombre de racines réelles multiples = 0 et nombre de racines réelles distinctes = 2. 


7.2. Exemple 2 


Voici les coefficients dans l’ordre des puissances décroissantes d’un polynôme de degré 5. 
ao = 1 ai = —2 ap = —1 az = 4 a4 = —2 as = —4. 


Ce polynôme admet une racine réelle double qui a pour valeur —1, deux racines complexes 
conjuguées 1 + ż, et une racine réelle qui a la valeur 2. Le programme donne : 
nombre de racines réelles multiples = 1 et nombre de racines réelles distinctes = 2. 


7.3. Exemple 3 


Voici les coefficients d’un polynôme de degré 6 : 
ao = 1 @1 = —21 Q2 = 175 a3 = —735 a = 1 624 A5 = —1 764 GG = 720. 


Ce polynôme admet pour racines 1, 2, 3, 4,5, 6. Le programme donne 6 racines réelles distinctes 
et aucune racine multiple. 


7.4. Exemple 4 


Voici un polynôme de degré 10 qui admet comme racines : 4 fois la valeur 1, 3 fois la valeur 2, 
2 fois la valeur 3, 1 fois la valeur 4. Ses coefficients sont : 


a) = 1 Qi = —20 a? = 175 a3 = —882 @4 = 2835 as = —6 072 
A6 = 8777 a7 = —8 458 Ag = 5 204 ag = —1 848 @10 = 288. 


Le programme indique qu’il y a 6 racines multiples, et 4 racines réelles distinctes. Cet exemple 
montre qu'il ne faut pas espérer trop de cette méthode dès que le degré du polynôme atteint la 
dizaine, la perte de signification des nombres calculés devient la cause principale de cette mise en 
échec. Nous avons rencontré un problème semblable lors du calcul des racines d’un polynôme : 
si l’on dispose d’une machine utilisant 16 chiffres significatifs, on ne peut guère espérer calculer 
des racines correctes pour les polynômes de degré égal ou supérieur à 13. 


8. Éléments de bibliographie 


E. DURAND (1971) Solution numérique des équations algébriques, Tome I, Éditions Masson, 
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B | Polynômes orthogonaux 
relativement à une fonction 
poids. Généralisation 

de la méthode de Gauss 


Compte tenu de la grande simplicité d'emploi agrémentée d’une grande précision, on peut 
se demander dans quelle mesure la méthode de Gauss est susceptible d’être généralisée aux 
cas d’intégrales, ayant bien sûr un sens, mais présentant des singularités. Le plus souvent, ces 
singularités existent aux bornes du domaine d'intégration lequel peut être fini ou infini. 

Il n’est pas question de chercher à passer en revue le plus grand nombre de singularités, 
mais d'étudier, dans la mesure du possible, les cas les plus fréquemment rencontrés dans les 
applications. La méthode consiste à conserver les principes généraux qui ont permis d’obtenir la 
formule d’approximation de Gauss, et bien entendu, notre attention devra tout particulièrement 
porter sur l’utilisation des polynômes orthogonaux classiques. 

Nous montrerons l’existence de racines de ces polynômes exclusivement réelles et distinctes, 
ainsi que quelques autres propriétés générales. En résumé, ce chapitre présente les définitions et 
théorèmes utiles pour l’établissement de méthodes d'intégration généralisant celle de Gauss. 


1. Généralisation de la notion de polynômes orthogonaux 


On appelle suite de polynômes orthogonaux sur l'intervalle fini ou infini (a,b) relativement à la 
fonction poids w(x) définie positive ou nulle sur (a,b) une suite de polynômes : 


Wolz), Wi(x), Wo(x),..., Wa(x),... 


de degré respectivement 0,1,2,...,n,... et qui vérifient les relations : 
b 
IECLOLAC TE E (B1) 
a 


Cela implique que : 


doit converger quel que soit n. 
Remarquons que la suite n’est définie qu’à une constante multiplicative près. On peut choisir 
cette constante, comme nous l’avons déjà écrit, selon divers critères que nous rappelons : 
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1. Wn(1) = 1 pour tout n; 
b 
2. orthonormalité : f w(x)W2(x) dx = 1, pour tout n positif ou nul; 


Q 
3. le coefficient de la puissance la plus élevée du polynôme a une valeur fixée à l’avance ; lorsque 
cette valeur est égale à 1, on dit que le polynôme est à coefficient principal réduit. 


Il nous reste à justifier l'existence d’une telle suite. Considérons la suite de fonction linéaire- 
ment indépendantes : 


EN am) w(x), … 


Le procédé d’orthogonalisation de Schmidt (1876-1959) nous permet d'obtenir un système de 
fonctions orthogonales répondant à notre question. On obtient alors : 


Wo(z)Vu(x), Wi(x)}Vw(x),..., Wa(x)1/w(x), 


où Wo(x),Wi(x),...,Wi(x),... sont respectivement des polynômes de degré 0,1,...,n,... 


2. Décomposition d’une fonction f(x) sur la base des polynômes W, (x) 
orthogonaux sur l'intervalle (a, b) 


Théorème liminaire 


Tout polynôme Q,(x) de degré n est représentable par une somme finie de polynômes W;(x) 
de degré inférieur et égal à n. 

Pour démontrer cette proposition, il suffit de reprendre la technique analogue à celle que nous 
avons mise en œuvre lors de l’étude des polynômes de Lagrange (chapitre 6). Développons Q,(x) 
selon les puissances décroissantes de x : 


n 
Quiz) = ao” + at”? +- + an = X apa". 
k=0 
Il nous suffit de remarquer, alors, que : 
1. 1 est proportionnel à Wo(x) : 
1 = aooWo(x) ; 

2. x est une fonction linéaire de Wo(x) et Wi(x) : 

x = an Wo(t) + a1100Wo(x) ; 
3. x? est une fonction linéaire de Wo(x), Wi(x) et Wo(x) : 

r = ao2Wo(x) + a2Wi(x) + az2W(x), 


et ainsi de suite. 
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Ces différentes expressions reportées dans Q,(x) donnent directement pour Q,(x) une forme 
linéaire en W(x) : 


Qn{x) = boWo(x) + b1Wi(x) eee + biWa(x). 


On en déduit la relation suivante : 
b 


J DM A A E 


a 


À présent, intéressons-nous à la fonction f(x) pouvant être légitimement approchée par le 
polynôme R,(x) sur l'intervalle (a,b) dans les conditions du théorème de Weierstrass; nous 
pouvons écrire : 


f(x) = Ra(x) +e(x) où e(r) est le résidu ou le reste. 
Rh(x) peut se décomposer sur la base des polynômes W,(x) : 
Rat) = coWo(x) + cW (£) +---c,W,(æx). 
Pour obtenir les coefficients cg, il suffit de multiplier les deux membres de l’équation précédente 


par w(æ)Wk(x), puis d'effectuer l'intégration sur l'intervalle (a,b) dans la mesure où celle-ci a 
un sens. 


b 


b 
JR, (Wit) dz = ck [mo dz 


a 


en vertu des relations d’orthogonalité. En posant : 


b 
AE J w(z)W2(x) dx 


on peut alors écrire : 
i b 
a= J w(x)Ra(z)We(x) de. 
a 


Autrement dit, on choisit comme approximation de f(x) un polynôme R,(x) de degré n qui 
vérifie les relations : 


avec k = 1,2,...,n. 
Du point de vue strictement mathématique, la décomposition est d’autant plus précise que la 
valeur de n est élevée, et cela en vertu du théorème de Weierstrass. 
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3. Racines des polynômes orthogonaux 


Théorème 
Les zéros d’un polynôme de degré n appartenant à une suite de polynômes orthogonaux 
relativement à la fonction poids w(x) sur l'intervalle (a, b) sont réels, distincts et compris dans 
l'intervalle (a, b). 

Considérons lexpression suivante : 


elle signifie que Wo(x) et Wn(£) sont orthogonaux. Comme w(x) n'est jamais une fonction 
négative dans l'intervalle (a,b), il s’ensuit nécessairement que W,(x) s’annule au moins en un 
point dans l'intervalle (a, b). Désignons par £1, £2,..-, Zp tous les points où W,(x) s'annule. Le 
polynôme : 


I(x) = W,(x)(x — zi)(x — x2)... (x — xx) = Wn(£)X (£) 
conserve un signe constant dans l'intervalle (a,b). Xp (x) est un polynôme de degré k. Faisons 
Phypothèse que k soit plus petit que n. Il vient : 
b 
J w(2)Wn(2)Xp(2) dz #0 


puisque W,(x)X4(x) garde un signe constant sur l'intervalle (a,b). Par ailleurs, X£(x) est 
décomposable en polynômes W;(x) de degré égal et inférieur à k, soit : 


Il s'ensuit que : 


en vertu des relations d’orthogonalité puisque n Æ k par hypothèse. On en déduit que k doit 
être égal à n puisque l'intégrale précédente est différente de zéro pour k = n. Par conséquent, 
ceci nous conduit à affirmer que le polynôme W, (x) de degré n possède n racines réelles dans 
l'intervalle (a,b). 

Il nous reste à montrer qu’il ne peut y avoir de racines doubles. Pour cela, supposons que la 
h° racine soit double, dans ce cas la forme : 


(x) = W,(x)(x — 21)(x — z2)... (£ — ER)... (£ — tn 1) 
est définie positive sur (a,b), mais il en est de même pour le polynôme : 
U(x) = W(x)(x — 21)(x — z2)... (£ —£r—1)(£ — ny)... (£ — En-1) 


et l’on retombe exactement sur le raisonnement précédent. On en conclut donc que toutes les 
racines sont distinctes (ou racines simples), car par le même processus on montrerait qu’il ne 
peut y avoir de racines triples, quadruples et ainsi de suite. 
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4. Relation de récurrence entre trois polynômes orthogonaux consécutifs 


Théorème 


Entre trois polynômes orthogonaux consécutifs, il existe toujours une relation de récurrence de 
la forme : 


Walz) — (Ant + Bn)Wn_1(t) + CnWn_2(x) = 0 (B.2) 


où An, Bn et Cn sont trois constantes qui ne dépendent que de n. 
Pour obtenir ce théorème, on procède de la manière suivante : d’abord on ajuste le coefficient 
An en identifiant les termes de degré n, ce qui revient à écrire que : 


I(x) = Walz) — AnWh-1(x)t 


est un polynôme de degré (n — 1) au plus. 
Développons alors T(z) sur la base de polynômes W;(x) : 


(x) = aoWo(x) + a Wi(x) +---+an 1Wn_1(x). 


En écrivant les relations d’orthogonalité pour k < (n — 2), on obtient : 


b b 
IÉCLOLC dz = An f eww ale) dx = 0 
a a 
car xW,(x) est au plus un polynôme de degré (n — 2). On en conclut que : 
ao = Q1 = Q2 = Q3 =... = An-3 = Q. 
Il suffit de poser : an-2 = —Cn et an-1 = Bn pour obtenir la relation de récurrence proposée. 


L'intérêt de ce théorème repose sur le calcul effectif des coefficients des polynômes orthogo- 
naux ; il suffit de connaître la relation de récurrence ainsi que les coefficients de deux polynômes 
consécutifs (généralement les deux premiers Wo(x) et Wi(x)) pour obtenir tous les coefficients 
des autres polynômes. 


5. Généralisation de la méthode de Gauss 


La méthode de Gauss généralisée s’applique au calcul d’intégrales de la forme : 
b 


1= | wa) dr 


a 
où f(x) est une fonction régulière sur (a,b) représentable par un polynôme sur cet intervalle et 
où w(x) est une fonction définie positive ou nulle sur (a,b) pouvant présenter des singularités 
sans pour autant altérer la convergence de l'intégrale 7. Du reste, dans le cas le plus général, 
les singularités se présentent aux bornes a ou b du domaine, lequel, rappelons-le, peut être fini 
ou infini selon les cas. On conserve la relation (7.12) du chapitre 7 pour calculer une valeur 
approchée de l'intégrale 7, soit J cette approximation : 


n 
J=} H;f(x;) (B.3) 
j=0 
et l’on conserve également le critère précédemment retenu pour obtenir les H; et les z; : il faut 
que I = J si f(x) est un polynôme arbitraire dont le degré est le plus élevé possible ; on désigne 


par Qn(z) ce polynôme. 
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5.1. Calcul des x; 


Reprenant la relation (7.12) du chapitre 7, on écrit l’expression : 
$ n 
0= SO HjQn(r)Wan(t;). (B.4) 
j=0 


Les z; sont les racines du polynôme W,41(x) appartenant à la suite de polynômes orthogonaux 
sur l'intervalle fini ou infini (a, b) par rapport à la fonction de base w(x) non négative sur (a, b). 


5.2. Calcul des H; 


Comme nous avons vu que chaque polynôme W(x) possédait k racines distinctes, on peut 
encore écrire : 


War(x) = a [Le — £p) 
k=0 


expression dans laquelle a est le coefficient du terme de degré le plus élevé. On poursuit les 
calculs de la même manière que celle abordée lors de l'étude des polynômes de Legendre. Du 
reste il suffit de s'apercevoir que le calcul des H; ne fait appel qu’à la seule orthogonalité pour 
obtenir la nouvelle expression des H}, soit : 


b 
AA 1 Whu(x) 
H; = MG) Joe dx 


n 
ou bien 


H; = Walz) (B.5) 


où K dépend de la suite particulière de polynômes envisagée. Son expression est donnée par : 
a 
K= T O,n+1 
GO ,n 
Où do,n €t Aon+1 sont respectivement le coefficient du terme en x” du polynôme W,(x) et le 
coefficient du terme en z”! du polynôme W,,41(x) ; ce rapport est calculé à partir de la relation 
de récurrence entre trois polynômes consécutifs en identifiant les coefficients des termes de degré 
(n + 1). Par ailleurs, I, est la norme de W, (x) : 
b 
In = [oema dz. 
a 


En revanche, pour obtenir une expression analogue à (7.17) du chapitre 7, il sera nécessaire 
d'examiner chaque suite particulière de polynômes orthogonaux. 


6. Expression de l'erreur en remplaçant I par J 


L'expression (7.20) du chapitre 7 est quelque peu modifiée bien que le calcul demeure le même 
dans son principe. On obtient alors : 


je) 
(an)? (2n+2) 


où ln41 est la norme du polynôme W,,.1(x) et an+ı le coefficient principal (coefficient de z”t!). 
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C |Les fractions continues 


Aujourd’hui, l’enseignement traditionnel effectué en France ne fait plus guère état de l'existence 
des fractions continues, pourtant ces êtres mathématiques ne sont pas tombés complètement en 
désuétude car ils demeurent un remarquable procédé de calcul des fonctions usuelles qui sont 
installées dans les calculateurs. De plus, l'étude des approximants de Padé (1863-1953) ainsi que 
les fondements théoriques de l’epsilon-algorithme sont indissociables des propriétés essentielles 
des fractions continues. C'est la raison pour laquelle nous avons pensé qu’il était utile d’en 
présenter les éléments. 


1. Un exemple de fraction continue 


L’exemple qui va nous servir d'introduction à la présentation des fractions continues n’est rien 
d’autre qu’un aspect du problème de l’interpolation. On se propose de déterminer une certaine 
fraction rationnelle : 


(C1) 


où P (z) et QA(x) sont chacun des polynômes de degré n de telle sorte que y prenne la valeur 
b; quand x prend la valeur aj. On voit que 2n + 1 couples de valeurs sont nécessaires à la 
détermination de la solution; on les numérote de 0 à 2n. On peut écrire (C.1) de la façon 
suivante : 

y = bo + -e (C.2) 
Pa-1(x) 


cette forme montre bien que y = by quand æ = ag. Écrivons que l'expression (C.2) prend la 
valeur b; quand x = a; (j # 0) : 


Qn(a;) _ aj- ao 
Pn-1(a;) bj — bo (C.3) 


le second membre n'étant rien d'autre que l'inverse de la différence première divisée ; notons- 
la ô(ao,a;}, j prenant les valeurs 1,2,...2n. Rappelons que les différences divisées sont les 
différences premières, deuxièmes etc. (rencontrées lors de l'étude des polynômes d’interpolation) 
divisées chaque fois par un terme du type (a; — ax) j # k. 
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Rien ne nous empêche de traiter l'équation (C.3) comme nous avons traité l'équation (C.1) 
en écrivant : 


Qt) æ— a 
Pae) = ô(ao, a1) + Pra) A (C.4) 
Qn-1() 
Écrivons que l'expression (C.4) prend la valeur b; quand z = a; (j # 0,1): 
Ph-1(a;) âj — Q0 (C.5) 


Qn-1(aj) (ao, aj) ~ 8(ao,&) 
le second membre n'étant rien d'autre que l'inverse de la différence deuxième divisée ; notons-la 
(ao, &1,a;), j prenant les valeurs 2,3...2n. 

En poursuivant la procédure jusqu'à j = 2n, et en notant (ao, &1,a2,...a>) l'inverse de la 
différence 2n° divisée, on aboutit à l'expression : 


y = bo + a (66 


r-a 
ô(ao, a1) + : 


T — Q2 


ô(ao, a1, a2) + 
T — Agn-1 


õlao, @1;:42,..., An) 
La fonction y est donnée sous forme appelée fraction continue, et l’on verra un peu plus loin 


comment calculer numériquement une telle expression au moyen de relations de récurrence qui 
permettent d'obtenir la quantité définie par la relation (C.1). 


ô(ao, a1, a2, a3) Erren 


2. Les fractions continues finies 


Par définition, on appelle fraction continue Rn d'ordre n une expression telle que : 
; pp p q 


ap 


Ra = bo + 


ai 


bi + 
a2 


Q 
+b3 + = 


An— 
Hate 


bn 
Comme cette notation n'utilise pas une écriture linéaire, on préfère de façon très usuelle les 
formes conventionnelles suivantes : 


Ra = bo + ao/bi +ai/b2 +- + an—1/bn, 
ou encore : 
al EAE an-ı] 
on 


ak s’appelle le numérateur partiel tandis que bp s'appelle le dénominateur partiel. Si l’on 
développe une fraction continue finie, comme on l’a vu à propos de l’exemple précédent, elle 
prend la forme d’une fraction rationnelle que l’on note : 


Rn = bo + 


ANNEXE C. LES FRACTIONS CONTINUES 


Toujours par définition, on appelle réduite d’ordre p (avec q < n) d’une fraction continue 
d'ordre n, la fraction continue tronquée à l’ordre q, notée : 


À 
RE; 
q B, 


2.1. Relations de récurrence entre les termes des réduites 


En écrivant les réduites successives on trouve : 


Ao 

Bo ou bo, 

À: ai _ bobi + a 

Br CU "2 

A2 Pa ai pi bob1b2 + a1b2 + a1bo 
Ba  bi+o/b bib + a2 


soit encore : 
Az _ b2Áı + a240 
B2 b2Bı + a2Bo 
Cette dernière expression se généralise de la manière suivante : 
Ap . bpAp-1 + apAp-2 
Bp bpBp-1 + apBp-2 


(C.7) 


Signalons que cette façon d'écrire contient deux égalités : celle des numérateurs et celle des 
dénominateurs. Nous allons démontrer la relation (C.7) par récurrence en faisant la supposition 
qu'elle est vraie pour la valeur p; examinons alors la réduite d’ordre (p + 1) : 


Apa 


R = 
p+1 


Pour réaliser les calculs, il suffit de remplacer bp par bp + ap+1/bp+1 dans la réduite d’ordre p. 
Nous obtenons : 


ap- 
(e + z 3 Ap-1 + ApAp-2 
Ro4 = = , 
(» + en) Bp—1 + apBp-2 
bp+ 


soit encore : 


R, = rbet + p+1)Ap-1 + apAp-2bpri 
i (bpbp+1 + ap+1)Bp-1 + apBp—2bp+1 


ce qui peut encore s’écrire : 


bp+1 (bpAp-1 + ApAp-2) + ap+1Ap-1 
bp+1 (bpBp-1 + apBp-2) + ap+1Bp-1 | 


Rp+1 = 


et puisque Ap = bpAp-1 + ApAp_2 
et Bp = bpBp-1 + ApBp-2 
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nous obtenons : 
Ap+1 _ Op+14p + Ap+1Ap1 | 
Bp+1 bp+1Bp + Qp+1Bp-1 


Rp+ı = 


Ces deux dernières relations sont celles que l’on obtient en remplaçant p par (p + 1) dans 
les équations (C.7). Comme les expressions (C.7) sont vraies pour p = 2, on en déduit par 
récurrence qu'elles sont générales. Par ailleurs, si l’on désire pouvoir également les utiliser pour 
n = 1, il suffit de choisir les conventions A; = 1 et Bı = 0. 


2.2. Une autre relation intéressante 
Multiplions À,41 par Bp et Bp}1 par Ap, puis retranchons membre à membre les relations de 
récurrence. Nous obtenons : 
Ap+1ıBp a Bp+14p = —Qp+1(ApBp-1 F Ap-1Bp). 
En posant Up+1ı = Ap+1 Bp — Bp+14p, on obtient la relation : 
Up+ı = —ap+1Up. 


Comme U, = A1 Bo — B1 Ao = a1, on trouve en définitive : 
p+1 
Up+1 = Ápt Bp — Bp+14p = (1) | [ ax, (C.8) 
k=1 
ou encore, en divisant (C.2) par le produit B,B,4+1, on établit : 


+1 
Upri _ Apu An 1 + 


1)? 
BpBp+1 Bp+ı Bp l ) BpBp+1 Il 


ak. (C.9) 


2.3. Propriétés essentielles 
On admettra sans démonstration les deux propositions suivantes : 


1. les polynômes A, et Bp des variables ao, a1, a2,- - . , Qp, bo, b1, b2,- .-, bp sont irréductibles entre 
eux, ou encore premiers entre eux, si les variables ap et les variables by sont indépendantes ; 
2. aucune réduite ne se présente sous la forme 0/0. 


3. Les fractions continues infinies 


Dans ce cas la fraction continue devient illimitée et la notion de convergence s’introduit tout 
naturellement lors de cette étude. 

Considérons la réduite Rn d'ordre n. Si Rn tend vers une limite R lorsque n croît indéfiniment, 
on dira que la fraction continue est convergente et a pour limite R. Dans le cas contraire, nous 
dirons qu’elle est divergente. 


Remarque : Supposons que ax = 0. Les relations de récurrence (C.8) et (C.9) nous donnent : 
AxBy-1 = Ak-1Bn = 0, 

Ar Ari =" 

Bg By: 

donc: Rx-1 = Rk = 0, 


soit : 


et la fraction continue est alors finie. On conclut que, si une fraction continue est infinie, tous 
ses ax sont différents de zéro. 
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Calcul des a et des bẹ à partir des réduites 


Du point de vue numérique, il va de soi que le calcul d’une fraction continue se ramène toujours à 
une approximation réalisée au moyen d’une réduite. Cependant, il est indispensable d'examiner 
sous l’angle de la légitimité les opérations susceptibles d’être réalisées. Il est possible de calculer 
les coefficients az et bx au moyen des réduites R,, R,-1 et R;-2. En effet, à partir des relations de 
récurrence établies au paragraphe 2, nous obtenons un système linéaire dont la solution s'écrit : 


AB A NB, ABg-2 — Ag-2Ba 


Qq = e b= . 
1 Aq 1B 2 — Áq 2B4 1 à Aq 1Ba 2 — Ày 2B4 1 


On remarquera que les relations (C.7) sont définies à une constante multiplicative près ; on 
obtient alors des fractions continues dites équivalentes, tout simplement parce que toutes les 
réduites sont égales. Il s'ensuit que les réduites dépendent de paramètres arbitraires non nuls. 
Choisissons comme contrainte linéaire : 


Bq = cyBg-1. 
Nous pouvons écrire : 
PEER I oiu E N Ra- Ro 
q qĉq— a — Ca 5 
Rai — R-2 Ra- — Ra-o 


Il est souvent commode de choisir arbitrairement les cq égaux à 1, on obtient alors des expressions 
très simples : 

Roi E7 Ra 
Rg—1ı — Rq-2 


Res 


Ag = PRE en z 
q 
Rg-1 pe Rg-2 


et b= 


4. Développement en fraction continue à partir d’un développement 
en série entière 


On considère le développement en série suivant : 


o 
S — J Ui, 
i=0 


et l’on souhaite que les sommes partielles Sp soient égales aux réduites Rp de la fraction 
continue R : 


al a| 


R=b+— +++ +. 
bı [bo [bn 
Compte tenu des résultats obtenus au paragraphe précédent, on peut écrire : 
Soi —S Sa — Sa- 
ag = I z et by = = — aiai 
Sq-1 — Sa-2 Sa-1 — Sa-2 
Si l’on tient compte du fait que S, — S,_1 = Uq, nous pouvons écrire : 
u Ug + Ug- u 
nt ne 
Ug—1 Ug—1 Ug—1 
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ce qui permet d'obtenir le développement suivant : 


ul U/w]  up/upil 
D J1 +uz/u |1 + up/up-1 


R = uo + 
Remarque : Si nous connaissons les réduites d’une fraction continue, réciproquement, il lui 
correspond une série dont le terme général u, s'écrit : 


uk = Rk ii Rk. 


5. Développement en fractions continues de séries usuelles 


Considérons le développement général d’une fonction en série de MacLaurin : 


OO 
S= X art. 
k=0 


Nous obtenons, par application directe du résultat établi au paragraphe 4, le développement en 
fraction continue suivant : 


az] &œ2z/az]| , Qp/Op-17| 


R = ao + TAR 
0t 1 [1+a/aœx 1+a,/ap 1 


D'un point de vue pratique, c’est-à-dire dès que les applications sont en vue, on a tout intérêt 
à procéder à la transformation de la suite des œp de la manière suivante : on forme la suite des 
Bp obtenue en posant : 


Bo = ao 
B = æœ 


Ba = Ag/Ag-1 avec q > 2, 


ceci a pour but une économie évidente de calcul. Par application de ce procédé, on obtient les 
développements suivants : 


z| Pz] 2x (p — 1)?x| 
l 1 = l E E E E ; 
oge(1 — x) tR- Bea ep avec |x| < 1 
mx| x(m — 1)/2| z(m—p—1)/pl 
1 m] = a e | 
és i [1 |1 +gz(m —1)/2 |L +z(m -— p- 1)/p HORS 
arctan(x) al + el + aa aech Ca + Il < 1 
pes ….. ... à à 
L B-22 j5-— 32 Gp + D - (2p- Dr? nl 
Pr ou z|] 2x| Zn (p — 1)z| A: 


+e 
1 2+ |3+z |[p+z 


On notera que la convergence de la fraction continue est assurée dans le même domaine que 
celui qui assure la convergence de la série entière génératrice. 
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6. Développement en fraction continue à partir d’un produit infini 


Bien que les produits infinis ne jouent pas un rôle aussi important que celui tenu par les 
développements en série entière, il est tout de même intéressant de voir comment de tels produits 
permettent de générer un développement en fraction continue. Précisons que nous limitons notre 
étude aux produits infinis de monômes que nous écrirons donc sous la forme : 


P= [Tu + vi). 


Pour étudier la convergence de P, il suffit de passer aux logarithmes, ce qui permet de se 
ramener à l’étude d’une suite classique dont le terme général se met sous la forme : 


Un = log, (1 + un). 


Comme les suites |un| et |wn| convergent ou divergent simultanément, il suffit de s'assurer de 
la convergence de |u,| pour obtenir la convergence absolue du produit, lequel, alors, admet une 
limite non nulle. Donc, en définitive, on souhaite former la fraction continue F dont les réduites 
R, sont égales aux produits partiels P}. On entend par produit partiel d'ordre q le produit fini 
des q premiers termes du produit infini. Puisque : 


nous pouvons écrire : 


Due P;-1Pq Z Pi-1v4 an Vq (+v a) 
` Fg-1 — Po-2 Vg-1 — Fg-2 Vg-1 Lie 

PAE P- Pa-2 _ 1+ (1+ va)(1+va-1) E Vall + Va-1) 
i Pi — Po Ug—1 Ug—1 i 


ce qui permet de conclure que : 
bg = 1 — ag: 


En adoptant comme notation Py = 1, cela nous permet d'écrire bọ = 1, et puisque P) = 
1 +v, = Rı = bo + a1 /b,, cela entraîne que : 


Qı = V1 et bi = 1, 


ainsi nous obtenons la fraction continue 


ail a2] a3| aql 
R=1 C pee 
Se ea dans lea 
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Application à quelques exemples 


ot) = Il (: = a) ue (a — a La 
x! sinh(x) = Il (: + de) aq = Hors 
cosh(x) = Il ( de a; Mis) aq = Cr 
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D | Les approximants de Padé 
et de Maehly 


Le cadre de ce chapitre a pour toile de fond l'approximation des fonctions, qu’elles soient usuelles 
ou spéciales, que l’on retrouve très fréquemment en calcul. En filigrane, se pose le problème 
de connaître les moyens les plus économiques qui permettent de calculer les « fonctions de 
bibliothèque ». 

C’est à H. Padé (1863-1953) que revient le mérite de s'être interrogé sur ces problèmes et 
d’avoir recherché la méthode la plus efficace possible pour réaliser des calculs numériques de 
fonctions (voir la bibliographie). La méthode a été ensuite reprise par Maehly comme on le 
verra. Aujourd’hui encore bien des théoriciens continuent de poursuivre de tels travaux qui 
demeurent un vaste champ de recherche. Rappelons toutefois que les approximants de Padé 
sont intimement liés aux fractions continues de Lagrange (1736-1813) et que les algorithmes 
d'accélération de la convergence sont indissociables de ces études (cf. C. Brézinski p. 72 et 
suivantes). Du reste, les publications originales de Padé en 1892 et 1899 portent respectivement 
pour titre : «Sur la représentation approchée d’une fonction par des fractions rationnelles » et 
«Sur les développements en fractions continues de la fonction exponentielle ». 


1. Le théorème fondamental de Padé 


Par définition, un approximant est une fraction continue (cf. annexe C) qui a été tronquée à un 
certain ordre. Il en résulte qu’un approximant se présente toujours sous la forme d’une fraction 
rationnelle au sens le plus large. 

Soit f(x) une fonction développable en série entière au voisinage de x = 0 qui s'écrit : 


f(&) = ao + ax + at +--> avec ao # 0. 


Considérons le polynôme de degré q : 
4 . 
Pix) = lo + hg + ha? +-+ lyst = V list, 
i=0 


et formons le produit : 


f(z) - Pix) = 5 nc) ‘ a ist) = 


co 
(aklo + ax-1l1 + ak-2l2 +- + ak—qla)z", 
k=0 = 


k=0 
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expression dans laquelle on conviendra que les coefficients affectés d’un indice négatif sont nuls. 
Égalons à zéro les coefficients de degré p + 1,p +2,...,p +q. On obtient un système linéaire 
constitué de q équations à q + 1 inconnues que l’on écrit : 


Qp+1l0 + apli +ap-il2 + + ap-q+ilg =0 
ap+2l0 + Gp+1l1 + apl2 ++ Gp g+2lg = 0 


Gp+i  @p ap- @p-q+1| [lo 
QAp+2 Qp+1 Qp ce Ap-q+2 | l 0 (D 1) 
Gp+g Qp+q—1 Ap+g-2 -+ ap lq 


Comme le nombre d’inconnues est supérieur d’une unité au nombre d'équations, il est toujours 
possible de satisfaire l’ensemble de ces équations par des valeurs des inconnues telles qu’elles 
ne soient pas toutes nulles ensemble. Si l’un des déterminants de la matrice (D.1), obtenu par 
suppression d’une colonne, est différent de zéro, alors toutes les inconnues sont déterminées à un 
facteur multiplicatif près. En revanche, si tous les déterminants sont nuls, alors plusieurs valeurs 
peuvent être choisies arbitrairement. De préférence, on s'intéresse à la suite lo, l1, l2,...,lq qui 
commence par le plus grand nombre de zéros possible. Le polynôme P,(x) est alors divisible 
par une puissance de x dont l’exposant est noté wpq, exposant au moins égal à celui que l’on 
obtiendrait en adoptant toute autre solution. Cette valeur de l’exposant est nulle lorsque lo est 
différent de zéro. On note par R,(x) le polynôme dont le degré est au plus égal à p, soit : 


Pp P 
R(x) = X (ailo + il + ainola +: + ai qlo)t* = 5y bpr". (D.2) 
k=0 


i=0 


Alors on peut écrire : 
fx): Pix) = Rp(£) + e(z? ttt), 


expression dans laquelle e(x?*4+1) est un infiniment petit dont l’ordre est au moins égal à 
p+q +1. Il s'ensuit que l’on peut écrire : 

Rp(z) 

Pix) 

R; (x) 

P3 (2) 


f(z) ~ 


ou encore: f(x) = 


dans le cas où les polynômes R;,(x) et P(x) ne sont pas premiers entre eux (R3(x) et P(x) 
sont premiers entre eux). Quoi qu’il en soit, nous avons établi que la fonction f(x) pouvait être 
représentée ou approchée par une fraction rationnelle au voisinage de zéro. Notons que sous la 
dernière forme on aurait : 


P3 (x)f(£) = R;(#) + e(z? tatl), 


Remarque : Comme dans l'expression de P,(x) ou de P}(x), il y a nécessairement un terme 
constant différent de zéro, alors R,(x)/P,(x) diffère de f(x) d'un infiniment petit dont l’ordre 
est (p +q + 1 — wpq) qui est plus grand que la somme des degrés des polynômes de la fraction. 
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Théorème de Padé 


Parmi toutes les fractions rationnelles irréductibles dont les termes ont des degrés égaux au plus 
à p pour le numérateur et au plus à q pour le dénominateur, p et q étant des entiers positifs 
ou nuls égaux ou inégaux, il y a une fraction R,(x)/P,(x) qui fournit une approximation dont 
l’ordre est supérieur à celui de l’approximation fournie par une quelconque des autres fractions. 
Nous admettrons ce théorème sans démonstration (cf. les mémoires de Padé). 
Remarque 1 : Dans l’état actuel des choses, à notre connaissance, on ne sait pas dire quelle est 
cette fraction rationnelle. Cependant, l'expérience montre que ce sont les termes de la diagonale 
pour laquelle p et q sont égaux ou les termes de la première parallèle supérieure à la diagonale 
(première sur-diagonale) telle que p = q + 1, qui fournissent les meilleures approximations. 
Remarque 2 : On peut montrer que le nombre w,, est au plus égal à q, mais qu’il est aussi au 
plus égal à p. 
Théorème — Les polynômes R,(x) et P(x) ont l’un et l’autre un terme constant différent de 
zéro ; Wp4 désignant zéro ou un entier positif au plus égal au plus petit des deux nombres p et q, 
les degrés des termes R,(x) et P,(x) ont respectivement pour limite supérieure p —w,9, q —Wpg ; 
l’ordre de l’approximation a pour limite inférieure p + q + 1 —-w,. 
Ici encore, nous ne démontrerons pas ce théorème (cf. les mémoires de Padé). 


2. Sur le calcul effectif des coefficients 


Au départ, on connaît les coefficients du développement en série entière que l’on désigne par a;. 
Ensuite on calcule les lą en faisant dans le système (D.1) lọ = 1, ce qui permet de calculer le 
second membre du système linéaire. Comme les lą sont définis à une constante multiplicative 
près, on peut rechercher à exprimer les {x sous forme entière, mais cela demeure un problème 
secondaire. Pour terminer, on calcule les by à partir de l'expression (D.2) qui se développe selon 
les égalités suivantes : 

bo = aolo 

bi = a1lo + aoli 

bz = a2lo + aılı + aol2 

b3 = aglo + azli + aila + aol3 

ba = aalo + a3l1 + azla + aıl3 + aola 


et ainsi de suite. 


3. Estimation de l'erreur commise 


L'erreur strictement mathématique E|f(x)] commise en remplaçant f(x) par une fraction 
rationnelle s'écrit : 


Pour évaluer cette erreur il est commode de revenir aux équations de départ. On peut alors 
écrire : 


f(z): Pa(x) = Ralx) + Sp+a(z) 
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où Sp+ql(£) = E(xP* 941), Il est pratique alors d'écrire $,,4(x) sous une forme plus exploitable, 
soit : 


O0 
— gP+q+1 k 
Spk l I) =g $ CRT". 
k=0 


Les coefficients cy décroissent en général extrêmement rapidement si bien que le premier terme 
co est de loin prépondérant. Aussi cette remarque permet-elle d'estimer l'erreur qui est donc de 
l'ordre de : 

gr+a+i 


E{f(x)] = P(e) d 


Reste à calculer co. Pour cela, il suffit de reprendre le développement de f(x)-P,(x) et d'identifier 
_les coefficients des termes en zP+4+1, On obtient alors : 


q 
Co = Gp+q+1lo + Ap+qli + *** + apila = X lkūptq+1—k- 
k=0 


4. Développements de quelques fonctions en approximants de Padé 


4.1. Développements de exp(x) (exemple donné par Padé) 


On part du développement en série entière : 


r Ê rr 


4 [ee] 
x 
SPL EE SE ta ta te) apr". 
i ` k=0 


| 8! 


Nota - Pour des raisons de commodité d'écriture, on notera l'inverse d’un nombre au moyen 
du nombre souligné d’une barre, ainsi x = 1/x. 


a — Approximation par la fraction rationnelle p = 1, q = 3 - En choisissant lọ = 1, on 
obtient le système linéaire suivant : 


1 1 0 -2 
2 1 1 —6 
6 2 1 —24 
La résolution donne : 
L = —0,75 
lL = 0,25 


lą = —4,166 666 107? 


ou encore en multipliant par un facteur convenable : 


l= 24 
l =-—18 
L= 6 
gai, 
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À partir de équation (D.2), on tire les valeurs des b : 


bo = 24 
bi — 6. 
De là, on exprime l’approximant : 
24 + 6x 


PO re mie 


b — Approximation par la fraction rationnelle p = 2, q = 3 - On résout le système linéaire : 
1 1 —6 

2 1 —24 
6 2 —120. 


ID IN 


24 


D'où l’on tire, après multiplication par 60 : 


En reportant ces résultats dans les équations (D.2), on accède aux b; : 


bo = 60 
bı = 24 
b = 3. 


En définitive, on obtient l’approximant : 


= 60 + 24r + 3x? 
— 60 — 367 + 972 — z3 


exp(x) 


c — Approximation par la fraction rationnelle p = q = 3 - Les équations (D.2) donnent le 
système linéaire : 


6 2 1 «24 
24 6 2 —120|. 
120 24 6 —720 
Après multiplication par 120, nous trouvons : 

lo = 120 

l = —60 

b= 12 

l3 = —1 
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puis : 
bo = 120 
bı = 60 
b = 12 
b3 = 1 


d’où l’approximant recherché : 


_ 120 + 60x + 127? + z? 


eple) = 1 GO + 1227 — 25 | 


d — Approximation par la fraction rationnelle p = 4, q = 3 — Tous calculs faits, on trouve : 


a 840 + 480x + 120z? + 167% + zt 
X — . 
PU 840 — 360x + 607? — 4z? 


Dans le cas présent, nous avons multiplié les coefficients lą par 4 pour obtenir les bj sous 
forme entière. 

Avec une calculette, il est intéressant d’expérimenter ces différents approximants et d’en 
apprécier la précision. 


4.2. Développement de la fonction de Bessel d'ordre zéro Jo(x) 


Jo(z) s'exprime à l’aide d’un développement en série entière donné par l’expression : 
0 P 


soit encore : 


a — Approximation par la fraction rationnelle p = 3, q = 4 — Il faut résoudre le système 
linéaire suivant : 
—6? 4 =l 1 —24 
24? -6 4 -1 120 
-120 2 -6 4 -720° 
720? —120? 24? -6? 5040? 


lo =1 
l = 0,113 937 367 4 

l2 = 0,671 266 793 x 107? 
lz = 0,255 002 275 8 x 107 
l, = 0,565 105 6038 x 107”. 
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On en déduit les b4 : 


bo = 1 
bı = —0,886 062 632 6 

b> = 0,142 775 3005 

bs = 0,600 355 363 x 107 ?. 


b — Approximation par la fraction rationnelle p = q = 4 — On donne les résultats du calcul : 


lb =1 

l = 0,113 937 3674 

l2 = 3,315 091014 x 107? 

l3 = 8,160 869 521 x 10 

l4 = 1,084 070 461 x 1075 
puis, bp =1 

bı = —0,918 085 771 3 

bə = 0,171 400 8623 

b3 = —0,105 327 029 2 x 107! 

b4 = 0,208 963 998 1 x 1072. 


Remarque sur l'utilisation des approximants — Lorsque le degré des polynômes dépasse deux, 
on a alors intérêt, pour réaliser les calculs, à utiliser le schéma de Horner (1786-1837) qui fait 
gagner un nombre intéressant d'opérations. Soit dans le cas présent : 


L'N _ {[(b4x + ba)æ + baje + bije + bo 
É ( ) {lx + l3)x + je + hi} + lo 


4 

Pour se faire une idée plus tangible des approximants, on se propose de tabuler quelques 
valeurs de Jo(x). 

Cette tabulation amène plusieurs remarques. D’une part, les approximants de Padé étant 
extraits de développements en série de MacLaurin (ou de séries entières), donc valables au 
voisinage de zéro, sont également eux-mêmes valables au voisinage de zéro. Le tableau D.1, page 
suivante, montre à l'évidence que la précision de l’approximation se dégrade avec l’éloignement 
de l’origine. Cependant il est intéressant de noter que pour la valeur z = 6 l'approximation 
obtenue avec la fraction rationnelle p = q = 4 donne une précision de l’ordre de cinq pour mille 
ce qui reste tout à fait raisonnable. 


~ 


4.3. Développement de x—larctan(x) (exemple donné par Padé) 


On part du développement suivant : 


a? at rê rê 


zl E E E NE 
x arctan(x) 3 + à 3 + 3 + 


Approximation par la fraction rationnelle p = 3, q = 2 — On résout le système linéaire : 


Š 7 
Et. Š -9 
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Tableau D.1. Résultats numériques obtenus. 


T Jo(æ) tables Jo(x) Padé Jo(x) Padé 
p=4 q=4 p=3 q=4 

0,1 0,999 75 0,997 501 0,997 501 

0,5 0,938 5 0,938 469 0,938 467 

1,0 0,765 2 0,765 197 0,765 009 

2,0 0,2239 0,223 890 0,222 080 

2,5 —0,048 4 —0,048 383 —0,0479 

5,5 —0,006 8 —0,006 697 —0,022 6 

6,0 0,150 6 0,151 214 

7,0 0,300 1 0,305 75 

8,0 0,1717 0,208 

9,0 —0,090 3 23,38 

10,0 —0,2459 0,327 


ce qui donne : 


lo = 1 

lL = 1,111 111111 

l = 2,380 952 355 
d’où l’on déduit : bọ = 1 

bi = 0,777 777 TTT 

ba = 2,210 581 985 

b3 = —0,714 285 705 7 


4.4. Calcul de sinus et cosinus 


On se propose de calculer la fraction rationnelle adaptée à chacune des fonctions sinus et 
cosinus en se fixant pour x l'intervalle (0,7/4) car ce sont ces développements que nous allons 
utiliser pour fabriquer les fonctions de bibliothèque ultérieurement. Nous partons donc des 
développements en série de MacLaurin : 


2? xt x no € 
sue) = (1 re mo no pren ) 
R D: n a’ 
a a ar a 


On se propose de déterminer les fractions rationnelles p = q de telle sorte que l'erreur 
sur chacune des valeurs calculées (appartenant à l'intervalle précité) soit inférieure à 1078. 
Il s’agit avant tout d’une erreur purement mathématique liée à la troncature des séries. Cela 
du reste ne préjuge en rien des autres erreurs liées à l'exécution des calculs qui peuvent devenir 
prépondérantes notamment lorsque les calculs font apparaître des différences. Comme nous 
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l'avons vu précédemment, il faut d’abord connaître les approximants avant de procéder aux 
évaluations des erreurs. Nous allons donc calculer les approximants pour p = q = 2 puis 
p =q = 3 (cf. Tab. D.2), cela nous permettra d'effectuer un choix par la suite. 


Tableau D.2. 
sinus cosinus 

Cas p—q=2 
b= 1 b= À 
l = 3,282 898 283 x 107? h =  4,365079 365 x 107? 
l= 4,50937951 x 1074 l2 = 8,5978836 x 1074 
b= 1 b= 1 
bı = —1,338 383 838 x 107! bı = —4,563 492 064 x 107! 
bo = 3,312 890 813 x 107 bx = 2,070 105 82 x 10 2 

Cas p=aq=3 
l= 1 l= 1 
l = 2414321216 x 10 ? l = 2,940421 157 x 107? 
l2 = 2,760512714 x 1074 l2 = 4,237 288124 x 107 
l3 = 1,595035872 x 1076 l = 3,235543 474 x 1076 
bo = 1 bo= 1 
bı = —1,425 234 545 x 1071 bı = —4,705 957 884 x 1071 
bo = 4,585515911 x 107 b2 = 2,738 828 969 x 107? 
bs = —4,163 277 311 x 1075 bs = —3,723 422 695 x 1074 


L'erreur sera maximum en valeur absolue pour x = x/4. Donc, nous obtenons les résultats 
présentés dans le tableau D.3. 


Tableau D.3. 
sinus cosinus 
Cas p=aq=2 
c= 2,4 x 1078 | c= 4,2 x 1077 
E = 2,1 x 107° E = 3,6 x 1078 
Casp=q=3 
c=6 x 107! c= 1,34 x 1011 
E=2%x10 “4 E = 4,5 x 105 


En conclusion, pour obtenir huit chiffres significatifs exacts, on pourra prendre la fraction 
rationnelle p = q = 2 pour le sinus et p = q = 3 pour le cosinus. 


413 


MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ 


5. Généralisation des approximants de Padé, méthode de Maehly 


Comme nous avons eu l’occasion de nous en rendre compte les approximants de Padé donnent 
une excellente précision au voisinage de zéro ; rien d’étonnant à cela puisqu'ils ont été construits 
pour remplir cet office. Malheureusement quand on s'éloigne de zéro, cette précision décroît 
notablement. Si l’on souhaite pouvoir obtenir une bonne précision sur tout l'intervalle fini (a, b) 
que l’on réduira grâce à une transformation linéaire à l'intervalle canonique (—1, +1), il nous 
faudra développer non plus les fonctions en série de MacLaurin mais, bien sûr, en une série de 
polynômes de Tchebycheff (1821-1894). En effet, on sait que, parmi tous les polynômes de degré 
n à coefficient principal réduit, c’est le polynôme de Tchebycheff de degré n qui s’écarte le moins 
de l’axe des x sur l'intervalle (—1, +1) au sens de la norme du sup. Donc, si l’on développe une 
fonction en série de polynômes de Tchebycheff, la précision de l’approximation sera homogène 
sur tout le domaine, l’erreur oscillant entre deux extremums. 

On est en droit de penser que les erreurs auront un comportement identique pour les 
approximations par fractions rationnelles que l’on déduira non plus à partir de la série de 
MacLaurin mais à partir du développement en série de Tchebycheff. De plus on peut ainsi espérer 
construire de meilleurs algorithmes dans le cas de séries de puissances lentement convergentes et 
qui donneront de meilleurs résultats que les approximants de Padé dans le cas où l’on s’éloigne 
de l’origine. En revanche, ils seront moins précis dans le voisinage de zéro. 

Nous avons étudié les polynômes de Tchebycheff quand nous avons évoqué la méthode 
d'intégration de Gauss-Tchebycheff (cf. chapitre 8). Aussi serons-nous bref pour ce qui concerne 
leurs propriétés. 

Nous avons défini le polynôme de Tchebycheff de degré n au moyen de la relation (cf. cha- 
pitre 8) : 


Ta (£) = cos|n arccos(x)|, 
= | 


on a donc: To(x) et Ti(x) = x. 


Les polynômes de Tchebycheff obéissent aux relations de récurrence : 


Tai) — 22 Th (x) + Tn- (£) = 0 
Tntm(2) + Tin-m (£) = 2Ta(£) - Tnt), 


ainsi qu'à la propriété fondamentale d’orthogonalité (relativement à la fonction poids 


1/v1- z?) : 
+1 


Ta (2)Tm(2) 
A 


—1 


T 
dx = 3 mn. 


À présent nous allons rappeler comment décomposer une fonction f (x) en série de polynômes 
de Tchebycheff sur l'intervalle canonique (—1, +1) sans préjudice de la généralité puisqu'il est 
toujours possible de ramener tout intervalle fini 7 à cet intervalle. f(x) admet un développement 
unique en série de Tchebycheff donné par l'expression : 


f(x) = Ÿ_anTn(z), 
n=0 
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avec 


AET Jeon Er 


et Gp = — 


Le 


Remarque : Il n’est pas souvent simple d'obtenir les coefficients ax sous forme littérale. En 
revanche on peut les obtenir assez facilement par voie numérique au moyen de la méthode de 
Gauss-Tchebycheff qui fournit une remarquable précision. 


Cela dit, nous obtiendrons la méthode de Maehly par transposition directe de la méthode de 
Padé. On écrira : 


où ici R,(x) et P(x) représentent des développements en série de Tchebycheff. On peut montrer 
que l'erreur est de l’ordre de Th+441(æ). Comme dans le cas des approximants de Padé, les 
meilleures approximations sont obtenues pour p=getp=gq+l1. 

À partir de la connaissance des coefficients az, nous allons effectuer des calculs tout à fait 
semblables à ceux de Padé. Soit un polynôme de degré q écrit en termes de polynômes de 
Tchebycheff : 


On écrit alors : 
oo q 
= X bT(x) X GT;(2). 
k=0 i=0 


Il nous faut à présent développer ce produit de sommes, et pour cela il faut utiliser la seconde 
relation de récurrence que nous venons de rappeler. On obtient successivement : 


k=0 i=0 i=0 k=0 
OO q g OO 

=DD Mae) + Teale) 1] Dur Taal CDN Tiu(e 
k=0 i=0 k=0 
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Rappelons pour mémoire que les indices négatifs correspondent à des coefficients nuls. On peut 
également développer les deux sommes, puis regrouper les termes, ce qui donne en définitive : 


2f(x)P,(x) = To(æ)}(bolo + bia +--+ + balg + bolo) + Ti(x)(boli + bilo + boli 
+ bila + bals + + gala + bilo + boli + bsla +--+ + baala) 
+ To(x)(bol2.+ bili + bzlo + bola + bilg + bola + -+ + bg—2lq + balo + bzlı 
+ bala +-+- + bg42la) + T(x) (bols + bil2 + bol + bslo + bols 
+ bila + bals +--+ bla + blo + bali + bsla + ++ + bgrslg) +: 


La technique de calcul demeure la même que celle utilisée lors de l’étude des approximants 
de Padé. On égale à zéro les coefficients des polynômes de degré p + 1,p +2,...,p+ a, et l’on 
considère le cas classique où p > q. Dans ce cas, la somme 


bolk + bilki +" + ba-kla 


disparaît. En apparence on retrouve la matrice obtenue lors de l'établissement de la méthode 
de Padé, mais il convient de faire attention, car à chaque ligne de la matrice, il correspond 
une valeur de p que l’on ne retrouve évidemment pas sur l’autre ligne. Il faut, par conséquent, 
différencier attentivement les éléments selon la ligne à laquelle ils appartiennent. Pour mieux 
situer le problème considérons les matrices dans le cas p = q = 2. Avec la méthode de Padé on 
écrira : 


Qâ? y —43 
a3 A2 —@4 


et en se servant de la méthode de Maehly on aura : 


Q32 Q32 —A33 
Q43 Q42 — Q44 


et l’on n’aura pas légalité a32 = &s2, ni l’égalitéaus = a33. 
En revanche, on devra écrire : 


2a33 = 263 
2032 = b2 + Ba 
2a31 = fi + bs 
2a44 = 264 
2042 = b2 + e 
2043 = O3 + 8s 


expressions dans lesquelles les 84 sont les coefficients du développement en série de Tchebycheff 
que lon souhaite distinguer du développement en série entière. 


Un exemple : étude de la fonction loge(1 — 2ty + t?) sur (—1, +1) 


Nous allons procéder au calcul de deux approximants de Maehly sur cette fonction tout simple- 
ment parce que le calcul des coefficients de la série de Tchebycheff est réalisable formellement. 
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En effet, on trouve dans les tables : 


foet — 2t cos(x) + t°] cos(nx) dx = -Ir si <1, 
n 


0 
nr 


et froed — 2t cos(x) + {?]cos(x) dr = z si <1. 
0 


Le changement de variable x = arccos(y) nous permet de calculer les coefficients du 
développement en série de Tchebycheff. Pour fixer les idées, choisissons tout à fait arbitrairement 
le coefficient t égal à 0,5 ; reste donc à obtenir les coefficients du développement en polynômes 
de Tchebycheff de la fonction : log, (1 — x + 0,25). 

Il n’y a pas de difficulté à calculer les coefficients ax (cf. Tab. D.4). 


Tableau D.4. 
a = 0 a = —T/2 
az = —T/8 a3 = —7/24 
aa = —7/64 as = —7/160 
aş = —7 /384 az = —r /896 
ag = —T /2 048 ag = —T /4 608 
@10 = —7/10 240 &11 = —7/45 056 


Q12 = —7T/98 304 


a — Étude du cas p = q = 3 — Ce cas est présenté dans le tableau D.5. Pour des raisons 
évidentes de commodité de calcul, il sera judicieux de développer les polynômes de Tchebycheff 
pour obtenir f(x) sous la forme : 


p 
Xo br" 
fe) = F — > 


lj 
DE 
j=0 


On obtient alors les valeurs du tableau D.6, page suivante. 


Tableau D.5. Étude du cas p = q = 3 


b= 1 bo = 0,516155 562 

lı = —1,078 971 778 bı = —0,966 519 671 6 

l = 1,890 890 323 x 107! b> = 0,335 223 066 2 

lą = —7,339 252 452 x 1073 b3 = —0,273 101 370 2 x 107! 
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Tableau D.6. Étude du cas p = q = 3 


l= 0810910968 b, = 0,180 932496 
l = —1,056 954021 b, = —0,884 589 260 
2 = 0,378178065 b, = 0,670446 132 
t = —0,029 357010 b} = —0,109 240 548 


b — Étude du cas p = q = 4 - Les résultats sont présentés dans le tableau D.7. De là on tire 
les valeurs du tableau D.8. 


Tableau D.7. Étude du cas p = q = 4 


lo = +1 bo = —0,085 339 731 
lı = +0,439 993 085 1 bı = —0,460 239 216 
l2 = —1,171 670 047 b2 = —0,614 231 378 
l3 = +0,288 160 179 b3 = +0,453 766 143 
l4 = —0,013 102673 ba = —0,047 218 321 


Tableau D.8. Étude du cas p =q = 4 


l = +2,158 567 374 bo = +0,481 673 325 
l1 = —0,424 487 452 bi = —1,821 537 645 
2 = —2,238 518 707 ba = —0,850 716 186 
l = +1,152 640 716 bz = +1,815 064572 
l} = —0,104 821 387 b4 = —0,377 746 570 


Pour mieux apprécier les différentes méthodes, nous avons tabulé la fonction sous diverses 
formes dont le développement classique (cf. Tab. D.9, page ci-contre) : 
2 3 4 n 
T z z z 
log(1 =g- p2 n pe p Hen 
og(1+zx) =x 23 at +(-1)"- + 


6. Erreur liée à l’usage des approximants de Maehly 


On peut se faire une opinion sur la précision des approximations proposées. En effet, on peut 
écrire : 


D(z) = f(x): P,(x) — 5y akTk(£) = wpa Tp+q+1 (2). 
k=0 


L'erreur est donc de l’ordre de : A 2. Comme on peut considérer que P(x) = lo = 1, on en 
déduit que : 
E(x) = D(x) = wpgTp+q+1 (£), 


Wpq ayant été défini au paragraphe 1. 
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Tableau D.9. 
6 6 (—1)”z” 
T log{1,25 — x) 5 ag Tr(x) 5 u Maehly 
k=0 n=1 g 

p=q=4 

—1,2 0,896 088 024 0,847 958 0,042 759 0,896 046 
—0,5 0,559 615 787 0,558 333 0,548 071 0,559 616 
—0,1 0,300 104 592 0,301 856 0,300 034 0,300 104 
—0,01 0,231 111 721 0,232 049 0,231 102 0,231 113 
0,0 0,223 143 551 0,223 958 0,223 139 0,223 145 
0,01 0,215 111 379 0,215 798 0,215 106 0,215 113 
0,1 0,139 761 942 0,139 185 0,139 761 0,139 765 
0,5 —0,287 682072 —0,287 500 —0,287 671 —0,287 688 
0,7 —0,597 837 000 —0,595 837 — 0,596 951 —0,597 832 


7. Difficultés liées à la recherche d'une généralisation 


Il est naturel d'envisager l’usage d’autres polynômes orthogonaux, voire de fonctions ortho- 
gonales, offrant des propriétés intéressantes afin de former d’autres approximants. La difficulté 
essentielle repose sur le fait qu’il n’est pas aisé d’obtenir une relation simple entre les produits de 
polynômes orthogonaux telle, par exemple, la relation de récurrence utilisée avec les polynômes 
de Tchebycheff. On pourrait penser à des approximants formés à partir des séries de Fourier, 
mais il n’existera pas de différences fondamentales avec les approximants de Maehly, car on passe 
d’une représentation à l’autre par un changement de variable du type y = arccos(x). Quoiqu’il 
en soit, les approximants de Padé et de Maehly sont à la base du calcul de toutes les fonctions 
de bibliothèque existant dans les calculateurs arithmétiques quels qu’ils soient. Nous verrons 
dans la prochaine annexe E comment sont effectivement calculées la plupart des fonctions de 
bibliothèque à partir des approximants que nous venons d'étudier. 
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È Calcul des fonctions 
de bibliothèque élémentaires 


Le calcul des fonctions de bibliothèque repose sur la décomposition préalable de la fonction 
en deux parties qui seront le cas échéant une somme ou un produit. Cette décomposition 
est effectuée de telle sorte qu’une des parties soit calculée exactement et que l’autre soit 
une fonction dont l’argument est généralement petit devant l’unité. Très souvent, on évalue 
cette dernière fonction au moyen des approximants de Padé, de Maehly ou des fractions 
continues. Malheureusement, cette technique qui donne des résultats remarquables n’est pas 
systématiquement applicable. Considérons par exemple le cas des fonctions de Bessel, il n’est pas 
possible dans l’état actuel de nos connaissances de procéder à leur calcul par cette voie. En effet, 
on ne sait pas réduire le calcul d’une fonction de Bessel à un intervalle canonique au voisinage 
de zéro ou sur l'intervalle (—1, +1) qui nous permettrait ensuite d’utiliser les approximants déjà 
évoqués. 

Avant d'entreprendre à proprement parler cette étude, insistons sur le fait qu’on n'utilise 
jamais directement un développement en série pour calculer les fonctions de bibliothèque. On 
peut s’en persuader facilement en considérant le développement de exp(—x) qui nous servira 
de technique de calcul pour x = 10. Nous obtenons une série alternée dont le terme général va 
commencer seulement à décroître lorsque : 


107 <n! 
ce qui donne approximativement : 
n = 10. 


On conçoit sans difficulté que les sommes partielles vont être relativement importantes avant 
de décroître jusqu’à une valeur petite. Cela imposerait des mots-mémoire de taille importante 
et de fort longs calculs. 

Dans ce chapitre, nous nous attacherons à l'esprit de la technique du calcul d’un certain 
nombre de fonctions élémentaires. 


1. Calcul de exp(x) pour x appartenant à (—co, +00) 


L'idée de base pour calculer exp(x) (sur une machine qui fonctionne avec des nombres en 
représentation binaire) repose sur la décomposition de cette fonction en un produit du type : 


exp(x) = 2" exp(Q) (E.1) 
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de telle sorte que N soit un entier et Q un terme compris entre —1 et +1. Passant aux logarithmes 
en base 2, nous pouvons écrire alors : 


xlogo(e) = N +Qlog,(e) = N +n. (E.2) 


En remarquant au passage que log.(e) log. (2) = 1, on obtient sans grande difficulté N et n. 
N est la partie entière de x/log,(2) et n la partie fractionnaire du même rapport. Le calcul de 
log. (2) s'effectue au moyen d’un développement en série et l’on obtient pour log.(2) et donc 
pour log,(e) autant de chiffres significatifs qu’on le souhaite. Il s’agit là de constantes calculées 
une fois pour toute : log, (2) = 0,693 147 180 et log,(e) = 1,442 695 04. Il reste à calculer N et 
n, puis Q = nlog, (2). 

Du simple fait que la machine calcule en binaire, il n’y a pas d’erreur en calculant 2 puisque 
N est entier. On obtient donc n sans problème et l’on note que Q est compris dans l'intervalle 
—0,693 147 < Q < +0,693 147. 

Il reste à calculer la fonction exp(Q) ce que l’on réalisera par les approximants de Maehly par 
exemple. Nous aurons : 


avec 


Tableau E.1. 


bo = 1,905 369 087 lo = +1,905 369 014 
bi = 0,954 415 684 1 = —0,950 951 382 
ba = 0,190 992 815 l = +0,189 261 972 
b, = 0,015 822 193 l} = —0,015 540 073 


Le calcul des coefficients az peut se faire par la méthode de Gauss-Tchebycheff, mais il faudra 
calculer les valeurs de exp(xx), xx étant un zéro du polynôme de Tchebycheff de degré p, soit 
par un développement en série, soit par un approximant de Padé déterminé dans un précédent 
chapitre. Les coefficients que nous avons trouvés pour p = q = 3, en ayant développé les 
polynômes de Tchebycheff, sont présentés dans le tableau E.1. On aura donc : 


[(b5x + b3)£ + bile + bo | 

(03x + Le + lle + lo 
Il faut bien noter que les degrés p et q des polynômes formant la fraction rationnelle sont fonction 
de la précision recherchée. Il en va de même du nombre de chiffres significatifs qu’il convient 


de conserver. Ce problème doit être étudié pour chaque cas particulier comme il a été dit à 
l’occasion de l’étude des approximants de Padé et de Maehly. 


exp(x) = 
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Un exemple numérique — On se propose de calculer exp(35,257). pour cela on réalise la 
décomposition : 


zlog(e)=N+n 


qui donne : N = 50 et n = 0,865 099 03 d’où Q = 0,599 640 954. 
Voici les résultats trouvés par différents procédés, il convient de les multiplier par 1015 : 


9 
machine X S  axTk (x) Padé p=g=3 Maehly p = Qq=3. 


k=0 
2,050 786965 2,050 786931 2,050 787 5 2,050 7872 


2. Calcul de sin(x) et cos(x) pour x appartenant à (—c, +00) 


Compte tenu de la parité des fonctions, on se ramène à l’intervalle (0, 7), puis ensuite, on réduit 
le champ à (0,7/2) et enfin à l'intervalle (0, 7/4) puisque l’on dispose de relations du genre : 


sin (z — z) = cos(x) et cos (G — z) = sin(x) 


qui permettent de calculer sinus et cosinus sur l’intervalle (0,7/4). D’abord, on détermine les 
nombres n et N tels que : 


s=nr(N+n) avec 0<n<1, 
on en déduit que : 
sin(x) = (—1)™ sin(nr) et cos(x) = (—1)" cos(nx). 


Donc, pour l'instant, nous nous sommes ramené à l'intervalle (0, 7). À présent, voyons comment 
se ramener à l'intervalle (0, 7/2). Posons : 


. 1 
sı = signe 3 =n 


Si sı est positif, on écrit : sin(x) = (—1)™ sin(nın) et cos(x) = (—1)" cos(nı7). 
== (— 


Si sı est négatif, on écrit : sin(x) 1) cos(nir) et cos(x) = (—1)" sin(n1r). 


La dernière transformation consiste à obtenir l’argument de la fonction sinus ou cosinus dans 
l'intervalle (0,7/4). Il suffit de reprendre la technique déjà utilisée pour parvenir à ces fins. 


Posons : 
— ` 1 
82 = signe 2 nı 


De eoD Eag 
PUIS : =g S2 4 1}. 
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Si s2 est positif, on aura: sin(nim) = sin(nor) et  cos(n1x) = cos(n27). 
Si s2 est négatif, on écrit : sin(n17) = cos(n2m) et  cos(n17) = sin(n27). 


On calcule les fonctions cosinus et sinus des réductions au moyen des approximants de Padé 
obtenus respectivement pour p = q = 3 et p = q = 2 qui assurent une précision d’au moins huit 
chiffres significatifs. Il est possible de faire mieux encore, mais il nous a semblé préférable de nous 
attacher surtout à la philosophie générale. Cependant, lorsqu'il s’agit d’implanter une fonction 
dans un système, il n’y a plus aucun détail qui puisse être délaissé. À précision égale, l'algorithme 
qui contient le moins d'opérations logiques et arithmétiques — qui sera par conséquent le plus 
rapide — sera toujours préféré, économie de temps oblige. Ainsi, pour le calcul des fonctions 
cosinus et sinus, on obtiendra de meilleures performances si l’on réduit l'intervalle à (0, 7/6) sur 
lequel on adoptera les approximants de Maehly ; toutes choses égales par ailleurs, on conservera 
les mêmes principes que ceux qui viennent d’être développés, mais on ajoutera l’analyse des cas 
particuliers usuels tels que 7/2 et x/4 ou encore x/3 et 7/6. 


Exemples d'application 


a — On se propose de calculer sin(69, 674 361). Nous pouvons écrire : 
N=22 et n—0,17803792. 
Puis nous obtenons : 
sı =signe (0,5—-n)=+1 et n1—=0,5-—(0,5-n)=n. 


Il nous reste donc à calculer sin(n17). L'usage de l’approximant de Padé pour p = q = 2 établi 
dans un chapitre précédent permet d’obtenir le résultat suivant : 


sin(69,674 3617) = 0,530 612 1638 


le dixième chiffre «significatif » étant sujet à caution. Maintenant, on se propose de calculer 
cos(58,125 769 8).On obtient sans problème : 


N=18 et n—0,50200717. 


À partir de là, nous déduisons : 


sı =-1 et n—0,5+ (0,5 — n) = 0,49799283, 
puis: s2 ——1 et n—0,25+ (0,25 — n) = 0,002007 17. 


Il nous faut donc calculer sin(0,002 007 177), on trouve alors : 
cos(58,125 769 8) = —0,630 5668739 x 107 ?, 
les dix chiffres significatifs mentionnés sont exacts. 
b — Un autre exemple. On se propose de calculer sin(7,587 214583). On établit que : 
N=2 et n—0,41508541 
ce qui donne : 
S82=—1 et n2=0,08491459. 
En adoptant l’approximant de Padé p = q = 3 pour évaluer le cosinus, nous obtenons : 
sin(7,587 214583) = 0,964 628 186 9. 


L'erreur absolue sur ce résultat est inférieure à 510710, 
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3. Calcul de log.(x) pour x appartenant à (0, +) 


EÉcrivons le nombre x dans le système binaire. Nous obtenons en choisissant la représentation 
flottante : 


x = 0,b0b102b3bab5bebr ... 271 avec bo Æ 0. 
Posons N = 2+, de telle sorte que l’on puisse écrire : 


log. (x) = Llog.(2) + log.(Q). 


Autrement dit, on a æ = 21Q avec 1 < Q < 2. On reconnaît une technique tout à fait 
semblable à celle utilisée pour la décomposition de exp(x). 

Il reste à calculer log,(Q) avec 1 < Q < 2, opération que l’on réalisera soit avec les 
approximants de Padé soit avec les approximants de Maehly. Encore une fois insistons sur 
le fait que cette idée ne constitue que le principe du calcul. À titre d’exemple, on peut très bien 
utiliser les approximants de la fonction log(1 — 2tx +t?) en choisissant t = 0,5, soit log(1,25 — x). 
On obtient alors x = 0,25 et x = —0,75 comme limites de variation pour x. 

Proposons-nous de calculer log(35 784,351 74). En appliquant les règles précédentes, on obtient 
L = 15 et Q = 1,092 051 75. Il faut faire : 


æ = 1,25 — 1,092 051 75 = 0,157 948 25 
et l’on trouve : 
log(Q) = 0,088 061 275 
en adoptant l’approximant de Maehly pour p = q = 4. D'où le résultat : 
log(35 784,351 74) = 10,485 269. 


Ici le dernier chiffre est entaché d’erreur. 


4. Calcul de tangente et cotangente pour x appartenant à (—co, +00) 


Les raisons de parité permettent de travailler sur l'intervalle (0,0), tandis que la division par 
m ramène l'intervalle à (0,7). En appliquant la technique déjà évoquée pour les fonctions sinus 
et cosinus, on se ramène à l'intervalle (0,7/4). Bien sûr, on se souviendra que le produit de 
tangente et de cotangente du même argument est égal à l’unité. 

Ensuite, il y a plusieurs façon d'évaluer ces fonctions dans un intervalle réduit. On peut utiliser 
la fraction continue suivante : 


jet (5 js +5 Een, 


mais on peut aussi obtenir des approximants de Padé ou de Maehly à partir du développement 
banal de cot(x) : 


29 2%] Bap |x?" 
æcot(x) = 1 5D (2k)! 
k=1 ` 


où les B2 sont les nombres de Bernoulli (cf. p. 178). Cette série converge pour z? < n?. 
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5. Calcul de argtanh(x) pour x appartenant à (0, 1) 


Comme nous avons la relation : 


argtanh(x) = log (= t z) > 


T 


on peut adopter soit la fraction continue : 


1+r m2x? 
kg, (14) -F a pr TES 


ou encore le développement de Tchebychef : 


lo 1+2ax +a a artt 
Be 1—-2ar+a) sont 


où |z| < 1 dans chacun des deux développements. 


6. Calcul de arctan(x) pour x appartenant à (0, +) 


On pose x = tan(Q) ce qui est toujours possible. Ensuite, on divise l’intervalle (0, m/2) selon 
des angles en progression arithmétique donnés par la relation : 


Qx=(Kk- 0,5) avec toutefois Qo = 0. 


Si x est compris entre Qk et Qk+1, alors on peut écrire : 


kr bk 
arctan(z) = — + arctan | ax — 
q T + ak 


expression dans laquelle ax = cot(kx/q) et bk = 1 + a2. 
En règle générale, q dépasse rarement la valeur 12. Ensuite, on calcule la valeur de arctan du 
second membre au moyen de la fraction continue de Gauss : 


m?t?| 
arctan(t) = 14 Den Fm + i 


7. Calcul de arcsin(x) et arccos(x) pour x appartenant à (0, 1) 
On peut se ramener sans grand problème au calcul de arctan en remarquant que : 
arcsin(x) = arctan (z / Vis?) 
et  arccos(x) = 5 — arcsin(r). 
Cette remarque étant faite, il faut préciser que ce procédé est «long » en temps-machine, 


aussi préfère-t-on implanter une fonction arcsin(x) fondée sur les approximants ou les fractions 
rationnelles. 
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8. Calcul de la racine carrée pour x appartenant à (0, >) 


Il s’agit probablement de l’un des plus vieux algorithmes toujours en vigueur, dont la paternité 
reviendrait à Héron d’Alexandrie (1% siècle). Grosso modo, la technique consiste à obtenir un 
ordre de grandeur «convenable » de la racine carrée puis à appliquer la méthode de Newton 
dont la convergence est, rappelons-le, quadratique. En calcul binaire, on pourra poser : 


1 
r=2"n avec a <<i donc 4-1 < g < 4™., 


On obtient alors /x = 27 y/n. 
À présent, il nous reste à calculer y/n. Cette opération est réalisée au moyen de la fraction 
continue : | 


25 51087-3] 410274) 
7 n+2357 2 [n+157 2 


En introduisant cette valeur dans la formule de Héron-Newton : 
Yr+1 = (yk + n/ur)/2 
après trois tours d’itération, on obtient alors une précision relative sur y2 qui sera meilleure que 
4,5 107°. 
Exemple 
On se propose de calculer V17 584,348 33. On établit que : 


47 < 17 584,348 33 < 48 
et donc que : 4/17 584,348 33 = 2564/0,268 315 862. 


L'application de la fraction continue donne : yn = 0,518 098 408 4, laquelle, introduite dans 
la formule de Newton-Héron, permet d'obtenir : yn = 0,517 9921555 à la première itération, 
et y/n = 0,517 992 1447 à la seconde. 

En définitive, on trouve : 4/17 584,348 33 = 132,605 989, tous les chiffres significatifs sont 
exacts. 


9. Éléments de bibliographie 


A. RALSTON et H.S. WILF (1965) Méthodes mathématiques pour calculateurs arithmétiques, 
Dunod. 
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des fonctions de Bessel 


Les fonctions de Bessel occupent une place très importante dans les solutions de problèmes 
offrant la symétrie cylindrique et l’on peut dire que, dans la hiérarchie des fonctions qu’il 
est nécessaire de tabuler, elles viennent juste après les fonctions trigonométriques, la fonction 
logarithme et la fonction exponentielle, mais on a coutume de les faire rentrer dans la classe des 
fonctions dites spéciales. Il existe beaucoup d'ouvrages qui traitent des propriétés remarquables 
de ces fonctions, on en trouvera quelques uns cités en bibliographie. Notre but est de montrer 
comment on peut obtenir aisément ces tables numériques au moyen des algorithmes que nous 
avons établis. 


1. L'équation différentielle des fonctions de Bessel (1784-1846) 


L’équation de Laplace (ou de Poisson) à laquelle obéit une grandeur V(p,8,z) s'écrit en 
coordonnées cylindriques (p, 6, z) : 


8V agl ov + 1 V ®V z 
ôp p p @ 80 92 
On recherche les ‘solutions sous forme de produits de Laplace : 


V(p, 8,2) = R(P)O(®)Z(2), 
ce qui nous autorise ensuite à passer en dérivées droites : 
d’R 1 dR v? 

- 1 = 0, F.1 

dep dp ( P) ie 


c’est cette équation différentielle qui est appelée équation de Bessel. Réécrivons-la plus conven- 
tionnellement en terme de y(x) : 


dy 1 dy n? 
+ 1 = (. 
dz? ii xz dx t 3) 0 


Cherchons une solution sous la forme d’un développement en série entière que l’on écrit : 


CO 
y =" d'or (F.2) 
j=0 
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On peut voir sans grande difficulté que tous les coefficients a; dépendent du coefficient ao. 
Par définition, les fonctions de Bessel de première espèce sont celles pour lesquelles le coefficient 
arbitraire ao est égal à : 


1 
“= aTa) 
où T(x) est la fonction gamma ; en définitive, elles s’écrivent sous la forme : 
r © (—1)™ gym 
Are Re - F. 
Ja) (z) Dae aT N) (QE 


Sans entrer dans les détails, il existe une deuxième solution, indépendante de la première, 
appelée solution de Weber (1842-1913), qui donne naissance aux fonctions de Bessel de deuxième 
espèce ; elles s’écrivent (si v est différent d’un nombre entier) : 
J a(x) cos(rr) — J_,(x) 


sin(rv) 


Y, (x) = (F4) 


Si v est entier égal à n, cette dernière expression est une forme indéterminée ; en appliquant 
la règle de l'Hospital, nous obtenons la solution : 


Yn (z) = 2 Jala) loge (©) ad 5 (n-m-1)! ~ 


! 
mao m: 


r 2 m! Ey (BD (Fm) + E(m +n), (F.5) 


où Ÿ(zx) est la dérivée logarithmique de la fonction factorielle, à savoir : 


T'(1 +7) 
Y(x) = —— F.6 
œ) = Hits (0) 
encore appelée fonction digamma. Si x est un nombre entier appelé n, nous avons : 
1 1 1 1 
P(n) = — E E 
C e a A 


avec  Y(0) = —y = —0,577 215 664901 5328 (constante d’Euler). 


Ce sont les expressions (F.3), (F.4) et (F.5) qui font l’objet de la programmation pour obtenir 
les tables désirées. 


2. Relations de récurrence 


Les deux espèces obéissent aux mêmes relations de récurrence, donc en désignant par W,(x) 
Pune et l’autre des deux fonctions nous pouvons écrire : 


zWi(x) = vW, (x) — zW, (£) 


rW! (z) = -vW, (x) + zW,_1(x) 
n ) = Ws- (£) — Wi4(x) 
W, (z) = W,- o) + Wo1 (2). (F.7) 
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On peut fonder quelques espoirs sur cette dernière relation de récurrence si l’on cherche à 
calculer les fonctions de Bessel d'ordre entier comme c’est généralement le cas. 

À partir de Wo(x) et Wi(x), on peut calculer W,(x) ; malheureusement, le jeu des erreurs dû 
aux soustractions nous conduira très rapidement à des résultats peu précis et l’on ne peut pas 
espérer dépasser pour n une dizaine d’unités, mais tout dépend du nombre de chiffres significatifs 
retenus pour effectuer les calculs. Du reste une application sera présentée pour le calcul de J_,(x) 
servant au calcul de Y, (x) pour v non entier. 


3. Représentation de J,,(x) par une intégrale définie 


On admettra sans démonstration les résultats suivants : 


7/2 
2 x\? . 2v : 
J,(x) = WOEST (3) J sin? (t) cos[r sin(t)] dt 
1 Œ\? f 2v . 
= CD (5) J sin” (t) cos{x sin(t)] dt (F.8) 
2 T\Y / 2\v—1 
J, (x) = VTT & +1/2) (5) fe —u ) /2 cos(xu) du (F.9) 


avec cette restriction toutefois que v > —1/2. 
Cette dernière relation est une excellente expression qui s'intègre élégamment par la méthode 
de Gauss-Tchebycheff et fournit des résultats d’une remarquable précision. 


4. Technique de calcul 


a — Le calcul de J,(x) avec n entier s'effectue au moyen de l'intégration numérique de la 
relation (F.9), et pour plus de précision nous calculerons séparément Jo(x) et Jı(x) au moyen 
des relations : 


1 
z 
et Ji(x) = — f costa) V1-t dt. 
T 
21 
b — Le calcul de J,(x) avec v non entier s’effectue au moyen de la relation (F.9). Bien qu’il n’y 
ait aucune différence apparente dans le calcul de J que l’ordre soit entier ou non entier, nous 
avons tenu à la séparation des deux types, les fonctions de Bessel d’ordre entier étant de très 
loin les plus utilisées. 
En ce qui concerne le calcul de la fonction gamma qui figure dans les formules, on utilise 
l’expression intégrale suivante : 


qui se calcule aisément au moyen de la méthode de Gauss-Laguerre. 
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c — Le calcul de Y, (x) avec v non entier est réalisé au moyen de la formule (F.4) dans laquelle 
on devra calculer J_,(x) que ne permet pas de calculer la relation (F.9). On l’obtiendra au 
moyen de la relation de récurrence (F.7). 


d — Le calcul de Y, (x) avec n entier est fondé sur l'exploitation de l’expression (F.5) qui utilise 
le calcul de Ge 

Sur le Web ve on trouvera un ensemble de programmes besselin.c, bessellf.c, 
bessel2n.c, bessel2f.c, besseljf.h, besseljn.h et besselyn.h qui réalisent ces différents 
calculs. La précision obtenue est donnée dans les commentaires en tête des programmes. 


5. Calcul de l'erreur sur Jo(x) 


Nous partons de l’expression intégrale de J(x) 


1 
rte if cos(rt) dt 


V1-t 
évaluée par la méthode de Gauss-Tchebycheff pour laquelle pèse une erreur de l’ordre de : 
E= Mon+2 (2n + 1)!! B Moin+2 1 


Q@n+2) Hnt! 2n+2 24n D 
Mon-2 est aisé à obtenir et sa valeur est : 
jet, 


Comme nous avons choisi n = 100, nous pouvons faire usage de la formule de Stirling pour 
s'affranchir de la fonction factorielle, et nous obtenons : 


log B(e) = (En + 2) 10g. ( [ele ): 


2n +2 


Pour fixer les idées, cherchons les valeurs de x qui permettent d’obtenir une précision absolue 
de 10-20 sur Jo(x), en choisissant toujours n = 20 : 


[x] = 54. 


D'un point de vue pratique, cela signifie que tous les chiffres significatifs de la tabulation 
sont exacts, la seule source d’erreur étant la propagation de l'erreur à travers l'opération de 
troncature des opérations arithmétiques effectuées. 

Pour ce qui concerne les autres fonctions de Bessel de première espèce, il est difficile d'exploiter 
une relation générale qui donnerait directement une majoration de M2,2 pour Jx(x), toutefois, 
pour les premières valeurs de k, le calcul direct en faisant usage de la formule de dérivation de 
Leibnitz permet d'aboutir. 


6. Éléments de bibliographie 


A. ANGOT (1972) Compléments de mathématiques, Éditions Masson. 

G. GOUDET (1962) Les fonctions de Bessel, Éditions Masson. 

C. MULLER (1998) Analysis of spherical symetries in euclidian spaces, Springer. 

E.T. WHITTAKER et G.N. WATSON (1992) Modern Analysis, Cambridge University Press. 


*http://www.edpsciences.com/guilpin/ 
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G | Éléments succincts 
sur le traitement du signal 


Dans ce chapitre, nous allons évoquer quelques aspects des principales fonctions mathéma- 
tiques utilisées en théorie du traitement du signal. Il s’agit plus spécifiquement des notions de 
convolution et de corrélation. 

Ce chapitre ne fait pas partie à proprement parler du calcul numérique mais en est une 
application directe, c'est dans ce sens que nous présentons un certain nombre de notions 
élémentaires qui font aujourd’hui l’objet d’un traitement direct sur ordinateur. En vérité, il 
n’est pas à dissocier des chapitres consacrés à l'étude statistique des résultats d'expériences en 
général. 

Par définition, un signal est le résultat de la mesure d’une grandeur physique qui varie dans 
le temps. Le signal peut se trouver à la sortie d’un capteur qui délivre soit un signal continu 
(analogique), soit un signal numérique (échantillonnage). C’est généralement une tension qui est 
recueillie dont l’amplitude et la phase dépendront du temps t. Nous désignerons par a(t) et b(t) 
les parties réelle et imaginaire associées au signal z(t) : 


z(t) = a(t) + jb(t). (G.1) 


1. Puissance et énergie d'un signal 


a — Par définition, la puissance instantanée du signal z(t) est donnée par l'expression : 


p(t) = la(t)]? + [B = [a(t) + jola) — jolt) = zlta” (t), (G.2) 
où xæ*(t) désigne la quantité complexe conjuguée. 
b - La puissance moyenne sur un intervalle T, à partir du temps to, est donnée par : 
to+T 
Pt T) = 2 J z(t)z* (t) dt, (G.3) 
to 
s’il s’agit de signaux physiques, z(t) est réel, et l’on écrit : 
to+T 


BTE I z(t}? dt, (G.4) 
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c — La puissance instantanée d'interaction de deux signaux z(t) et y(t) s'écrit : 


Pay = T(t)y"(t) 
et Pyr = y(t)z*(E) 
d’où la relation : Pry = Pyr 
et dans le cas des signaux réels : Pry = Pys = t(t)y(t). 
d — La puissance moyenne d'interaction de deux signaux sur un intervalle T s'exprime au moyen 
de la relation : 
to+T 
1 * 

Palto T= | sv à (G.5) 


Palto T) = 7 | vO at (G.6) 


ce qui permet d'écrire : 
Pry(to, T) = Pis(to, T), 


et dans le cas de signaux réels : 


Pate T) = Palto T) =F | 200 dt: 
to 


e — On apporte quelques modifications à ces définitions si l’on a affaire à des signaux transi- 
toires, lesquels sont, par définition, à support borné. (Ils sont nuls hors d’un intervalle fini bien 
déterminé.) On préfère alors définir lénergie d’une autre façon au moyen de la relation : 


tı +00 


pre J z(t}y*(t) dt = Î z(t}y"(#) dt. (G.7) 


to — 00 


f — Rappel du théorème de Parseval — Il s’agit, pour le physicien, de l'expression du principe 
de conservation de l'énergie (ou de l'information) quel que soit l’espace de représentation : 


+00 +00 
J z(t)y* (t) dt = J rar aa 


où X(w) et Y (w) sont respectivement les transformées de Fourier de z(t) et y(t). Dans le cas 
où x(t) = y(t), on obtient : 


+œ +00 
Î L(H)I(E) dé = I |X (w)? dw. 
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Densité de puissance ou densité spectrale énergétique — C’est la fonction S,-(u0) égale à la 
dérivée de la puissance P(w) par rapport à la fréquence w (il s’agit de la puissance définie au 
paragraphe 1 exprimée en fonction de la fréquence) : 


dP(w) 
dw 


Types de signaux — Les signaux rencontrés au cours des expériences réelles sont essentiellement 
de trois types : 


Sar (wo) Z 


pour w = wo. 


a. Les signaux périodiques, 

b. les signaux «transitoires » qui ne sont pas périodiques mais qui sont localisés dans l’espace 
direct, 

c. le bruit. 


Aux signaux évoqués en a et b se superpose, dans le cas général, un bruit. Celui-ci est bien 
représenté par une fonction aléatoire ayant la propriété de stationnarité (la moyenne, l'écart 
quadratique etc. sont indépendants du temps). De plus il n’est ni périodique ni localisé dans 
l’espace direct. 


2. La corrélation et ses propriétés 


Sans nuire à la généralité, nous limiterons notre propos aux phénomènes dépendant du temps. 
Plus précisément, il s’agira le plus souvent de considérer un ensemble de fonctions représentant 
le même phénomène physique donc de fonctions réelles. 

Voici quelques exemples : les enregistrements de tensions délivrées par des capteurs pour 
réaliser un encéphalogramme, un électrocardiogramme, l’enregistrement de la température en 
un lieu donné, l'enregistrement du taux de COs dans une ville donnée, l'enregistrement du 
spectre d'émission d’un astre, etc. 

La question alors qui se pose est de savoir si le processus P, qui donne naissance aux fonctions 
z(t) et le processus physique P, qui donne naissance aux fonctions y(t) sont en relation. La 
réponse se trouve dans la fonction de corrélation qui consiste à comparer x(t) et y(t) à différents 
instants. L'idée repose sur la mesure de la surface commune au graphe de z(t) et au graphe 
de y(t) décalés entre eux d’une quantité 7. Cette surface est une fonction du décalage r. Plus 
le signal y(t) aura tendance à reproduire l’allure du signal z(t) après un décalage 7o, plus la 
surface commune sera «grande » et plus les processus physiques seront corrélés. Si les signaux 
z(t) et y(t) sont différents, la fonction de corrélation s’appelle intercorrélation, tandis que si les 
signaux sont les mêmes on parle de fonction d’autocorrélation. L'expression de la fonction de 
corrélation s'écrit au temps to : 


to+T 

Con) = Jim x f aO- r) dt, (G.8) 
to 
to+T 

Cralto, T) = Jim à J z(t)z(t — 7) dt. (G.9) 
to 


Un exemple physique de fonction de corrélation : les interférences. 
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On peut imaginer qu’il s’agit d’interférences lumineuses. On désigne alors par z(t) l'amplitude 
de la radiation émise par une source lumineuse. Après la différence de marche 7, les interférences 
seront données par la fonction Y(+,T) : 


T(t, T) = xt) + r(t- 7). 
Comme l'intensité Im au point M est la moyenne du carré de l’amplitude, nous écrivons : 
Im = (V°?) = (a(t?) + (e(t — T) + 2{x(t)r(t — r)). 
S'il s’agit d’une source lumineuse non cohérente : 


Im = 2[02 + Czz(T)], 


æ?(t) dt. 


Cxx(T) détermine la variation (spatiale) de l’énergie moyenne en fonction de la différence de 
marche 7. Ici la fonction de corrélation donne la forme des franges d’interférences. 


où : 


où = (a(#)?) = 


SE 


2.1. Cas de la fonction d’autocorrélation 


Il est intéressant de donner les principales propriétés de la fonction d’autocorrélation concernant 
les trois types de signaux. Quel que soit le signal : 


1. La fonction d’autocorrélation Cræ(T) est paire, soit : 
Crz(T) = Cra(—T) 


et sa transformée de Fourier est réelle et paire. 

2. Le maximum de la fonction de corrélation est atteint pour la valeur T = 0. C;4(0) représente 
la valeur quadratique moyenne du signal. 

3. Sauf pour un signal périodique, limr_, Crz(T) = 0. 

4. Théorème de Wiener-Kinchine (sans démonstration). La densité spectrale d'énergie et la 
fonction d’autocorrélation sont transformées de Fourier l’une de l’autre. 


TF 
Cat) —> Srx(w). 
TF! 


Dans le cas où un signal n’a pas de composante continue $,(0) = 0, alors à partir de : 


+00 
Srz(w) = i Crz(t)expl2rjwt) dt, 


on déduit que : 


ce qui signifie que la fonction d’autocorrélation a une surface algébrique nulle. 
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Dans le cas d’un signal périodique e(t) de période T, la fonction d’autocorrélation est 
également périodique de période T. Dans ce cas, le signal est décomposable en série de Fourier, 
soit : 


Gis 


z= 2rkt 
` b 
cp 2. fer cos 27 cos —— R k Sin T | ; 


pi 


on en déduit la fonction d’autocorrélation (définie sur une période) : 


1 h Tr nk 2rkt 
Cra(T) = 7 f e(t)e(t — -7j X > [rost op ai | 
—T/2 =T/2 
2rk(t — 2 = A 
Fn REET a sin da D a t54 X [ax +0] ] cos Te - 
k=1 


2.2. Cas de la fonction d'intercorrélation 
Dans ce cas, il n’y a plus de propriétés extrémales ni de parité. 
a — Coylt) = Oyal). 
b — Le théorème de Wiener (1894-1952) - Kinchine (1894-1959) demeure : 
TF 
Crylt) —>  Seylw). 


FT! 


Sxy(w) est la densité énergétique d’interaction, elle est liée à l’information échangée entre les 
deux signaux. 

Dans le cas de deux signaux périodiques de même période T, la fonction d’autocorrélation est 
également périodique de période T. 


3. Applications de la corrélation 
La corrélation trouve des applications fondamentales dans les domaines suivants : 


3.1. Détection et extraction d’un signal périodique noyé dans du bruit 


On considère un signal e(t) périodique, de période Te auquel s’est superposé un bruit (4). Le 
signal délivré est alors : 


s(t) = e(t) + b(t). 


On désigne par Css(T} la fonction d’autocorrélation : 


eA 


T 
=; Je + lelt — 7) + BE — r)] dt, 
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qui s'écrit encore : 
Css (T) = Cee(T) + Ces(r) + Cher) + Ceg(r). 
Puisque le bruit est indépendant du signal e(t), on en déduit que : 
Che(T) = Ceg(r) = 0. 


Par ailleurs, nous avons dit que Cgg(T) tendait vers zéro quand la période d'intégration T; 
tendait vers l'infini. Bien que la période T; ne tende pas vers l'infini mais est « suffisamment 
grande », on pourra admettre que : 


Css(T) = CeelT). 


Ainsi, les extremums successifs donnent la période Te du signal. 

Comment extraire ce signal périodique? 

C’est la fonction q(t) = sha(t) (peigne de Dirac) qui nous apporte la solution. Comme c’est 
une fonction paire, le résultat de la corrélation et le résultat de la convolution sont identiques 
à un facteur multiplicatif près (si l’on ne divise pas par 7; la corrélation). Or la convolution 
d’une fonction périodique e(t) avec une fonction peigne de même période laisse la fonction e(t) 
inchangée. Ce qui revient au même de dire que l’intercorrélation de la fonction périodique e(t) 
avec la fonction peigne de même période fournit la fonction e(t) elle-même. Donc : 


Csa(T) = Ceg(T) + Cpa(T) 
Cgq(r) est nulle et comme Ceg(T) = e(r), on obtient en définitive : 


CsalT) = e(r). 


Remarque : Lorsque le signal est susceptible d’être reproduit aux erreurs près dues au bruit, 
la somme des signaux successifs permet d'éliminer statistiquement le bruit. On a enregistré n 
fois le signal s;(t) = e;(t) + B(t). Nous écrivons alors : 


2 
© 
li 
SI 
Me: 
L 
È 
Il 
SI 

Me 
£ 
= 
+ 
sie 
M 
D 
= 
I 
31 
M 
£ 
= 


k=1 k=1 k=1 k=1 


car la moyenne du bruit est nulle + 57, £: (t) = 0. 


3.2. Calcul de la densité spectrale d'énergie 


La densité spectrale énergétique S,;,(w) est la transformée de Fourier de la fonction de corrélation 
Czylt) (théorème de Wiener-Kinchine). En général, c’est la fonction de corrélation que l’on sait 
calculer ; on en effectue la transformée de Fourier, et l’on obtient la densité spectrale d'énergie. 


3.3. Recherche du maximum de la fonction d'intercorrélation 


La recherche du maximum de la fonction d’intercorrélation fournit une mesure du temps de 
décalage entre une excitation e(t) et la réponse r(t) et par conséquent une mesure de la vitesse de 
propagation du phénomène. L'étude de la dispersion de la vitesse en fonction de la fréquence peut 
être abordée au moyen de la fonction d’intercorrélation puis du théorème de Wiener-Kinchine. 
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4. La convolution 


Tout instrument de mesure modifie le signal d’entrée e(t) pour délivrer un signal de sortie s(t). 
Cela est lié au fait qu’un signal d’entrée infiniment bref (impulsion de Dirac) a une réponse finie. 
Cette réponse impulsionnelle a(t) du système de mesure (supposé linéaire) est appelée fonction 
d'appareil. 

La fonction d’appareil d’un dispositif électronique peut s’obtenir en attaquant l'entrée par 
une très brève impulsion. Bien qu'il ne s'agisse pas d’un signal temporel, signalons toutefois la 
fonction d'appareil d’un spectrographe qui peut être obtenue, dans le voisinage de ào, par un 
laser de longueur d’onde Ao. 

On peut voir maintenant de quelle manière un signal d’entrée e(t) se trouve perturbé à la 
sortie s(t) par une fonction d'appareil a(t). 

Pour cela il suffit de décomposer le signal d’entrée e(t) en une suite «d’impulsions » de largeur 
At et dont l’amplitude sera e(kAt) avec k = 0,1,2,...,n. L'impulsion e(kAt) fournira à la sortie 
le signal : 


s(t) = e(kAt)a(t — kAt)At. 


Comme l'instrument de mesure est supposé linéaire, il y a additivité des s(t) pour recons- 
tituer le signal à la sortie, soit : 


nm 
s(t) = X e(kAt)a(t — kAt)At. 
k=0 

Par ailleurs la fonction a(t) étant nulle pour t < 0, cela revient au même d'écrire que a(t—kAt) 
est nulle pour t < kAt. Donc a(t) est à présent définie sur (—00, +00) et l’on a la relation : 


s(t) = e(kAt)a(t — kAt)At. 


— 00 
Un classique passage à la limite obtenu en faisant tendre At vers zéro donne le résultat : 


+00 


s(t) = f e(z)a(t — z) dz, 


00 
lécriture symbolique de cette équation étant s(t) = e(t) x a(t). 


Remarque 1 : En général, s(t) et a(t) sont les deux fonctions connues et c’est e(t) qui est 
la fonction inconnue. L’équation de convolution, qui est pourtant une équation fonctionnelle 
linéaire, offre bien des difficultés quant à sa résolution. Sur le plan numérique, les fonctions sont 
toujours à support borné et l’intégrale est finie. Cette équation devient donc une intégrale de 
Fredholm de première espèce qui est typiquement un problème mal posé (cf. chapitre 17). Sa 
résolution nécessite l’usage de méthodes appropriées telles que la méthode des régularisants que 
nous avons évoqué dans un paragraphe spécial consacré à l’équation de convolution. 
Remarque 2 : Les opérateurs de convolution et de corrélation se ressemblent beaucoup ; notam- 
ment si une des fonctions est symétrique ils ne différeront que d’une constante multiplicative. 
Dans les autres cas, la convolution consiste à renverser une des fonctions avant de procéder au 
même calcul que celui défini pour la corrélation. 
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Fonctions propres de l'opérateur de convolution 


En d’autres termes, il s’agit de rechercher les fonctions qui, convoluées par elles-mêmes, restent 
inchangées. Désignons par @(t) une de ces fonctions propres; elle doit obéir à l'équation : 


P(t)“ P(t) = kD(t), 
qui deviendra : P(w)¥ (w) = kt (w) 


dans l’espace de Fourier où Y(w) est la transformée de Fourier de @(t). 

La solution au sens classique est W (w) = a £ 0 sur un compact |w| < wo, et 0 ailleurs. C’est 
la fonction «porte » usuelle dont la transformée de Fourier inverse est : 

sin(2rwot 
Sos CT U0E) : 
27Twot 

Il existe aussi une solution au sens des distributions; il s’agit de W(w) = 8 sur l'intervalle 

(—00, +00) dont la transformée de Fourier inverse est S6(t). 


5. Notions sur le filtrage 


Par définition, un filtre temporel est une opération d'atténuation — voire d'interruption — sur 
un signal. Désignons par z(t) cette opération d'atténuation, par s(t) le signal à filtrer et par z(t) 
le résultat ; nous pouvons écrire : 


Le spectre de fréquence est modifié par cette opération et en passant dans l’espace de Fourier, 
nous obtenons : 
TF 
r(t) = z(t) s(t) —> X(w) = Zw) Sw). 
TF! 


On voit bien que tout filtrage temporel modifie le spectre du signal filtré. À titre d'exemple, on 
peut évoquer l’usage d’un potentiomêtre (ou d’un interrupteur), et le simple fait de «monter » 
ou «baisser » le son sur un amplificateur d’audiofréquences modifie le spectre entendu. Pour 
s’en convaincre, il suffit de réaliser plusieurs fois ces opérations plus ou moins rapidement sur le 
premier poste radiophonique venu. 


5.1. Exemple 


La fonction «porte » laisse passer le signal sur l'intervalle (—T, T) et sa transformée de Fourier 
Z(w) est : 
sin(27Tw) 

2rTw 


S(w) sera convolué par Z(w) et plus T sera «grand », moins l'effet du filtrage sera sensible. 


Z{w) =2T 


Remarque 1 : Le fait de découper un événement temporel dans le temps afin de l'étudier a 
comme conséquence la modification de son spectre. 


Remarque 2 : On peut appliquer l'opération de filtrage à la représentation fréquentielle (dans 
l’espace de Fourier). L'opération de convolution se fera dans l’espace direct. 
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5.2. Les filtres physiques 


Aux instants t < 0, un filtre physique ne peut avoir qu'une réponse nulle (principe de causalité), 
et à l'impulsion 6(t) on observe la réponse a(t) qui est nulle pour t < 0 et définie pour t > 0. 
Soit A(w) sa transformée de Fourier que nous écrivons : 


A(w) = U(w) +3jV(w) U et V sont réels. 


V (w) n’est jamais nulle car pour cela il faudrait que a(t) soit symétrique par rapport à t = 0 ce 
qui n’est pas possible. On peut adopter une autre présentation : 


A(w) = |A(w)|explig(w)] 


où |A(w)| est le module et (w) la phase. De là, on conclut que tout filtre physique déphase le 
signal d’entrée. 


5.3. Cas du monochromateur 


Il s’agit de concevoir un filtre qui ne laisse passer qu’une seule fréquence. Cela n’est pas réalisable. 
En effet, dans l’espace de Fourier, on doit obtenir deux raies infiniment étroites (cf. la fonction 
de Dirac) symétriques par rapport à w = 0 ou symétriques par rapport à l’axe w = 0. Dans 
l’espace direct, nous avons vu qu’il s’agissait soit d’une sinusoïde pure, soit d’une cosinusoïde 
pure lesquelles s'étendent toutes les deux sur (—co ; +00). 

Dès que l’on aborde les applications pratiques, on ne peut que tronquer ces fonctions et les 
considérer uniquement sur un intervalle fini. Cette opération de troncature est évidemment un 
filtrage temporel qui a comme conséquence immédiate l’élargissement des «raies » dans l’espace 
de Fourier. Transcrivons mathématiquement ces opérations : 

Soient e(t) le signal à filtrer et E(w) sa transformée de Fourier. Il s’agit donc de convoluer e(t) 
et a(t) = cos(2rwot), mais on voit bien qu’on ne peut pas réaliser la convolution sur l’espace des 
t tout entier, et il nous faut tronquer par la fonction porte p(t) dont la transformée de Fourier 
est P(w). 


TF 
e(t)*a(t) 4+—+  E(w)A(w) 
e(t)" [a(t p(t] Fa E(w)[A(w) P(w)] 


6. Notion de bruit 


Il y à diverses approches du bruit qui sont plus ou moins fécondes et riches de développements 
fructueux : 


6.1. Le bruit blanc 


On dit qu’un bruit est blanc lorsque son spectre de puissance est constant dans toute l’étendue 
des fréquences. Autrement dit, sa fonction d’autocorrélation est une impulsion de Dirac ô(t). Il 
s’agit là d’une analogie avec la lumière blanche. 

D'un point de vue pratique, un tel bruit n’existe pas; cependant, on dira que l’on a affaire à 
un bruit blanc lorsque la fonction est constante en moyenne dans la bande de fréquence utilisée 
par les systèmes considérés. Bien sûr la fonction d’autocorrélation calculée ne sera pas un pic de 
Dirac mais une courbe très étroite dans le temps, l’unité de temps étant les temps de corrélation 
considérés. Il s'ensuit que les hautes fréquences seront filtrées (le bleu s’il s’agit de la lumière) 
et il restera les basses fréquences (le rouge s’il s’agit de la lumière), d’où le nom de bruit rose. 
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6.2. Le bruit gaussien 


Soit un bruit dont la moyenne est m et l’écart quadratique moyen ø. On parle de bruit gaussien 
lorsque celui-ci suit une loi de probabilité p(t) gaussienne à savoir : 


es 


p(t) = Go 


Fe 

Le grand intérêt de ce type de bruit repose sur la simplicité de sa formulation analytique qui 
ne fait appel qu'aux deux premiers moments. De plus, dans bien des cas, la somme de processus 
aléatoires non gaussiens tend vers un processus gaussien, c’est ce que l’on rencontre dans la 
théorie des erreurs (voir le théorème central limite). Attention, cela n’est pas systématique, une 
somme de processus de Cauchy reste un processus de Cauchy. 
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L’annexe I contient les corrigés de la plupart des exercices énoncés ici. 


1. Généralités sur le calcul numérique 


1.1. Calcul du nombre d’or 


Soit la suite définie par les relations suivantes : 
Uo = 0 U1 = 1 3 Un+1 = Un + Un-1 


Cette suite s'appelle suite de Fibonacci (11807-1250). Montrer que la suite de terme général 
kn = Un/Un-1 tend vers une limite lorsque n tend vers linfini. 

Effectuer un programme permettant de calculer les termes de cette suite kn. Quel critère 
retiendra-t-on pour obtenir une approximation de la limite de la suite? Estimer la précision 
obtenue sur ce nombre. 

On peut calculer directement cette limite k. On montrera que k est la solution positive de 
l'équation du second degré : y? —y—1=0 
N.B. - La suite de Fibonacci est utilisée en informatique dans les problèmes de tris externes. 


1.2. Tabulation des polynômes de Tchebycheff 


Les polynômes de Tchebycheff sont définis de la manière suivante : 
T\(x) = cosinarccos(x)] avec —1<zx< +1. 
Établir la relation de récurrence suivante entre trois polynômes consécutifs : 
Tny (£) = 22Tn(x) — Tn- (2) 


et définir les deux premiers polynômes To et Ti. 

Effectuer un programme qui permette de calculer la valeur des polynômes quels que soient le 
nombre n appartenant à l’ensemble des entiers positifs et la valeur de argument x à l'intervalle 
(—1, +1). 

Quelles limitations viennent affecter cet algorithme? On comparera les résultats donnés par 
le calcul direct utilisant les fonctions inverses et l’utilisation de la relation de récurrence. 

N.B. - Les polynômes de Tchebycheff jouent un rôle essentiel dans le problème de l'optimisation 
des approximations de fonctions (chapitre 8). 


443 


MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ 


1.3. Calcul de la fréquence des notes de deux gammes 


Calculer les fréquences des notes de la gamme naturelle et de la gamme tempérée dans l'intervalle 
compris entre le laz (440 Hz) et le la4 (880 Hz). 


1.4. Calcul de la constante d’Euler 


La constante d’Euler que l’on rencontre lors du calcul des fonctions de Bessel de deuxième espèce 
est donnée par l'expression : 
1 1 1 
=limil+=+=+...+— logem 
7 +stati+z-los.(m) 
lorsque m tend vers l'infini. 
Réaliser un programme qui calcule y selon cet algorithme, et effectuer une estimation de la 
précision obtenue. 
Comme la vitesse de convergence est loin d’être satisfaisante, on préfère utiliser une autre 
ne pour calculer ~y 


3 


1 1 1 1 x Br 


Si 
aas =] j + 1 
k ogen) tr = Sm Bme Bomi Bme CD ns 


expression dans laquelle les Bẹ sont les nombres de Bernoulli (cf. chapitre 12). On donne les 
premiers nombres : 


1 1 1 
B=- B, = — B; = — 
176 27 30 3—42 
1 5 691 
Ba = — B; = — ri 
4730 5 66 57 2730 
7 3617 43 867 
Bz = - Re Be = 
7—6 8 510 ? 798 
_ 174611 „ _ 854513 _ 236364091 
10 ™ 330 1e 27 2730 
Les nombres de Bernoulli sont les coefficients du développement de : 
t t t? t4 r 
=1 B Bo + + (1) H Baa +. 
exp(t) —1 2 17 24 1 En t 


et par ailleurs, ils sont reliés à la fonction Ç de Riemann laquelle permet d’obtenir les relations 
suivantes : 


2S2n(2n)! 
Ba = ngn 
s 1 1 1 1 
avec a a tan tant Hgm 


Effectuer un programme qui réalise le calcul de y selon cette procédure. 

En machine (précision relative de 107°), déterminer expérimentalement combien on doit 
utiliser de nombres de Bernoulli au minimum pour obtenir la meilleure précision avec la machine 
utilisée (une fois m fixé). Ou bien calculer m sachant que l’on arrête le développement à l’ordre 
j compris, c’est-à-dire après B;. Pour mener à bien les calculs, on utilisera le fait que lerreur 
sur y est inférieure à deux fois le module du premier terme de la série abandonné (cf. G. Valiron, 
Théorie des fonctions, Masson, p. 218 et 219). 

La convergence est très rapide, cependant, la série infinie est-elle convergente? 
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1.5. Calcul numérique des dérivées d’un polynôme à coefficients réels pour la valeur x = r 


On considère un polynôme P,(x) à coefficients réels que l’on écrit : 
n 
x) 5 akz” avec ap £0. 


a — Rappeler comment calculer effectivement la valeur numérique du polynôme P,{x) pour la 
valeur z = r au moyen du schéma de Horner. On écrira les étapes du calcul au moyen d’une 
relation de récurrence que l’on explicitera donnant une suite que l’on appellera vk par exemple. 


b — On divise le polynôme P,(x) par (x — r}, et l’on écrit : 
Pa(t) = (z — r)Pa-1 (£) + Rn- (H.1) 


On poursuit la division des polynômes Pa—g(£) par (x — r). Écrire la relation de récurrence 
qui donne le polynôme P,-,(x), et montrer que : P(x) = (x —r)Po(x) + Rı, par la suite on 
posera P(x) = Ro pour des raisons de commodité d'écriture et d’homogénéité. 

Donner la relation de récurrence qui permet de calculer les coefficients du polynôme P4_1(x) 
en fonction des coefficients du polynôme P;(x). 


c — Réécrire lexpression (H.1) en éliminant tous les P(x) : PA(x) s'exprime en fonction de 
z,r et des Rx. 


d — Donner l'expression du développement du polynôme P,(x) en série de Taylor au voisinage 
de x = r + h en fonction de x,r et des dérivées de P,(x). En déduire la valeur de Rx. 


e — Montrer comment calculer effectivement tous les Rg à l’aide du schéma de Horner. 


1.6. Calcul numérique de la fonction € de Riemann 


Rappel du théorème de FEY — Soit f(x) une fonction positive et décroissante pour x > 1, 
alors l'intégrale 7I = [ f(x) dx et la série f(k) (où k est un entier strictement positif) 
convergent ou divergent Es 
Soit la fonction de Riemann 
1 1 1 1 
(s) = titg ti tat a cer LE 


35 5s ns ns 
n=1 


I 
| 


oo 
a — Associer l'intégrale I = f f(x) dx à la fonction ¢(s) en explicitant f(x), puis donner les 


1 
différentes expressions de J (obtenues par quadratures simples sous le signe somme) en fonction 
de s. En déduire la conditio de convergence de la série; au préalable, on aura représenté sur 


un graphique les termes 1, À E 4 ,-. ainsi que la fonction associée f(x). 
b — On désigne par S(s) la série de Riemann tronquée à l’ordre k : 


1 1 1 Mi 1 


En approchant (s) par S(s) on effectue une erreur de troncature strictement mathématique 
(indépendante de la troncature numérique des nombres) : 


1 1 1 
ex = + + Ho 
ET (+1) (+2) (k+3) 
Au moyen de l'intégrale associée, proposer un encadrement de e;, puis en déduire une méthode 
de calcul de 6{s) lorsque celle-ci converge. 
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1.7. Recherche d'une tangente commune à deux courbes 


On considère deux fonctions y = f(x) et y = g(x). À l’intérieur d’un domaine D du plan 
réel (Ox, Oy} elles admettent chacune, hormis les valeurs prises à la frontière du domaine, un 
extremum et un seul qui est un minimum. On suppose que, dans D, les fonctions f(x) et g(x) sont 
continues, dérivables au moins deux fois et qu’elles ne possèdent pas de points d’inflexion. Dans 
la suite, on s’intéressera aux courbes représentatives, Cı pour y = f(x) et C2 pour y = g(x), qui 
admettent une tangente commune dans D. On se propose de déterminer numériquement cette 
tangente commune. 


a — Soit (zo, yo) un point À du plan par lequel il est possible de tracer une tangente quelconque 
à chacune des courbes Ci et C2. Écrire les coordonnées du point (xf, yp) tangent à y = f(x), 
puis les coordonnées du point (£4, yg) tangent à y = g(x), la tangente étant issue de A. Indiquer 
une méthode de calcul numérique de ces coordonnées. 


b — S'il est possible de tracer, à partir de À, une tangente à une courbe alors il est possible, en 
P P g 

général, d’en tracer une seconde. Laquelle conviéndra-t-il de retenir pour la solution qui nous 

intéresse ? 


c — Pour l'instant, il n’y a aucune raison pour que ces deux tangentes constituent une 
tangente commune, et nous allons déplacer le point À sur la droite x = £o pour obtenir cette 
tangente commune. Donner un algorithme qui permette d'obtenir numériquement cette tangente 
commune. Comment devra-t-on choisir £o pour obtenir la précision optimum? 


d — Les courbes représentatives C} et C2 ne sont plus données par des fonctions explicites mais 
par des fonctions implicites qui s’écrivent : 


D(x,y)—=0 et  Y(xr,y) = 0. 


Ici encore, on suppose que les fonctions ont les bonnes propriétés usuelles de régularité 
(continuité et dérivabilité à l’ordre deux, pas de points d’inflexion dans D). Donner une procédure 
qui permette de calculer numériquement les coordonnées (£g, Yg) et (xs, yf) des points tangents 
aux courbes, les deux tangentes étant issues de A. Puis, proposer une procédure pour obtenir 
numériquement la tangente commune aux deux courbes. 


2. Algorithmes accélérateurs de la convergence des suites 


2.1. L'epsilon-algorithme scalaire 


a — En réaliser la programmation sous forme de sous-programme. Application à une suite 
lentement convergente : 


T 1 1 1 1 
ie Tes EE AE EEA E Tin 
F amh at. 


4 3'5 7 He 


b — Appliquer l’epsilon-algorithme au calcul de 


do 1 
Sn ne si | 
y im ( Data T oga(m)) 


À quel ordre m obtient-on le meilleur résultat avec une machine donnée? 
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2.2. L'epsilon-algorithme scalaire 


En réaliser la programmation sous forme de sous-programme. 


3. Les développements asymptotiques 
3.1. Développement asymptotique 


OO 
a — Soit la fonction : f(x) = ft-'exp(x — t) dt avec x > 0 encore appelée exponentielle 


intégrale. En intégrant successivement par parties montrer que f(x) admet un développement 
asymptotique dont on explicitera les coefficients. Montrer que la série est bien divergente 
quand n tend vers l'infini. Calculer l'erreur e,(x) commise lorsque l’on remplace f(x) par 
son développement S,(x) et montrer que €, (x) passe par un minimum qui dépend de n pour 
une valeur fixée de x. Montrer qu’en machine ce minimum est obtenu dans le voisinage de 
En(T) À EnH1(x) Où En-1(£) & En (x). On désigne par N la valeur de n pour laquelle on obtient 
ce minimum (N est une fonction de x). 

Effectuer un programme qui, pour une valeur quelconque de x, détermine N puis calcule la 
somme Sy (x) et enfin l’erreur mathématique ey (x). 

Appliquer l’epsilon-algorithme scalaire (cf. chapitre 2) aux sommes partielles S,(x) pour des 
valeurs de n quelconques plus petites et plus grandes que N, pour des valeurs quelconques de x 
(mêmes voisines de l’unité). 


b — On propose la même étude sur les fonctions suivantes : 
9 T 
(x) = — [e dt et  cerf(x) = 1 —- @(x). 
T 
0 


On montrera que 


= 1 1-3 1-3-5 1-3-5- (2n — 3) | 
3 ; Hess 


cerf(z) = = 22 Tom 93%6 SE OA on-ly2n-2 


4. Résolution des équations numériques 


4.1. Racines d'une équation f(x) = 0 


a — Réaliser un programme qui donne les racines d’une équation f(x) = 0 par dichotomie. 
Compte tenu de la précision relative de la machine utilisée qui est de 107”, donner le nombre 
de tours de dichotomie suffisant pour obtenir la meilleure précision sur la racine. On aura soin 
d’injecter la valeur de la racine trouvée dans l'équation f(x) = 0... 


b — Réaliser un programme qui calcule les racines selon la méthode itérative du premier ordre. 


c — Réaliser un programme qui calcule les racines selon la méthode de Newton (méthode 
itérative du deuxième ordre). 


d — Application — (Équation rencontrée lors de l’étude du corps noir) 
Chercher la racine non nulle de l'équation transcendante : 


y + 5exp(—y) — 5 = 0. 


Comparer les différentes méthodes, estimer la précision obtenue sur chacune des valeurs. 
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4.2. Méthode de Bairstow 


Dans le cas particulier des polynômes, plutôt que de faire usage des méthodes du genre de celles 
programmées au paragraphe 1, on préfère utiliser des programmes spécifiques dont la méthode 
de Bairstow est un exemple typique. Programmation de la méthode de Bairstow. 


Applications — Rechercher les racines du polynôme de Legendre d'ordre n que l'on note P, (x). 
Les polynômes sont donnés par les relations de récurrence : 


P(x) =] 
Pi(x) = LT 
(n + 1)Pai(£) — (2n +1)xP,(x) + nPn-1(x) = 0. 
À partir de quel ordre n commence-t-on à avoir de sérieux ennuis de calculs avec une machine 
dont les nombres ont une précision relative de 107? 
N.B. - Les zéros des polynômes de Legendre jouent un rôle fondamental dans la méthode 
d'intégration numérique de Gauss-Legendre. 


Même problème pour les polynômes de Laguerre et les polynômes d’'Hermite qui sont donnés 
respectivement par les relations de récurrence suivantes : 


Lo(x) = 

L(x)=1-7x 

Laulæ)+(æ-2n-—1)L,(x) +n/Ln-1(x) = 0 
et Ho(x) =] 

Hı(z)= x 

Hn (£) — Hn (£) +nHn-1(£) = 0 


4.3. Calcul de la fonction arctan(x) 
Connaissant la fonction tangente, a = tan(x), on se propose de calculer x = arctan(a). Montrer 
que l’on a l'identité : 

æ = arctan(a) — arctan[tan(zo)] + £o, 
puis en déduire que : 
a — tan(zo) 
1+atan(xo) 


z = zo + arctan ( ) = zo + arctan[F(xo)]. 
Donner le développement de x en fonction de X = F (zo). À quelle condition la série converge- 
t-elle? 

Calculer la valeur approchée de arctan (5) en choisissant comme première approximation 
zo = 0,8 et en se limitant à l’ordre 3. Quelle est la précision obtenue sur ce résultat ? 


4.4. Racine d'une équation f(x) = 0 


On considère une fonction f(x) continue dans un domaine A. À l'intérieur de ce domaine A, 
f(x) admet une seule racine X telle que f(X) = 0. On connaît une première approximation 
de X que l’on note zo. On se propose d'obtenir une meilleure approximation x; de la manière 
suivante : 

En Ao de coordonnées [xo, f(xo)}, on trace la tangente à la courbe y = f(x), puis on effectue 
une projection orthogonale du point Bo de coordonnées (x9,0) sur cette tangente. On désigne 
par Co cette projection dont les coordonnées sont (x1, y1). 
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a — Donner l'expression formelle de x, en fonction de xo, de la fonction f et éventuellement de 
ses dérivées. Proposer un processus itératif du type : 


Tn+41 = (Tn), 
on donnera explicitement (x). 


b — On désigne par en l’écart à la solution X après le n° tour d’itération : en = X — £n. 
Montrer qu’au premier ordre on peut écrire : en+1 = ken. On explicitera k en fonction de ® 
et de ses dérivées (ou de f et de ses dérivées). 
Donner les conditions pour que la suite des approximations soit toujours convergente vers X. 


c — En s’aidant de quelques figures simples, retrouver les conditions sur f (ou ses dérivées) 
pour que l’approximation gı soit effectivement meilleure que zo. Représenter au moins un cas 
pour lequel la méthode ne converge pas vers X. 


d — Comparer cette méthode à celle de Newton, c’est-à-dire que l’on donnera les avantages et 
les inconvénients que ces deux méthodes présentent comparées l’une à l’autre. 


4.5. Racines d'un polynôme à coefficients complexes 


On considère un polynôme de la variable complexe à coefficients complexes : 


Pa (2) = (ao + 580)2" + (on + jb)" + (aa + J82)? +- + (an + fn) 
avec @ào + 360 À 0. 


On désire obtenir une racine complexe de ce polynôme que l’on a localisée dans le domaine 
complexe A. Pour ce faire, on divise P,(z) par le monôme D:(2) = z — (p + jo). 


a — Montrer que le quotient, noté Q,-_1(z), est un polynôme de degré n — 1 et le reste est une 
constante complexe notée R = ® + jY. On écrit le polynôme Q,-_1(z) sous la forme : 


Qn-1(2) = (Yo + 560)2" 7? + (y1 + j1)? + (90 + 562) TS +- + (Yn-1 + Jôn-1). 


b — Expliciter les coefficients y% et 64 en fournissant les relations de récurrence auxquelles ils 
obéissent. On précisera convenablement le début et la fin des relations de récurrence. Donner 
les expressions de ® et de Y. Montrer que, pour que (p + jo) soit une racine, il faut et il suffit 
que les fonctions ® et Y soient nulles. 


c — Ë et Y sont des fonctions implicites des deux variables p et ø, rappeler la méthode de 
Newton permettant de les annuler simultanément. a za K PRIE en fonction ® et Y et 


de leurs dérivées partielles par rapport à p et o : Dp’ 30° 6 et Pe 


d — Calculer effectivement 0$/0p et OV/ðp en dérivant les relations de récurrence des 7; et 
des ĝą par rapport à p puis en posant T = tk—ı et 2k = uk—1. Ici encore, on explicitera bien 
p 


Op 


le début et la fin des relations de récurrence. 


e — Opérer de la même manière pour calculer 0&/ôc et 0Y/0o. On dérivera les relations de 


7 R Yk k 
récurrence des yk et des 0x par rapport à ø et l’on posera —— = Vvk-1 €t —— = Wk—1- 


o Ôo 
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f — Donner l'algorithme permettant de calculer la racine appartenant au domaine A. En 
supposant que toutes les racines aient été localisées chacune dans un domaine Az, proposer 
une méthode générale permettant de calculer toutes les racines complexes du polynôme P,(2) 
à coefficients complexes. 


4.6. Résolution d'un système non linéaire 


On se propose de résoudre numériquement un système non linéaire de n équations à n inconnues 
qui se note : 


F (£1, £2, 23,..., £n) = 0 avec g—1,2,3,...,n. 


a — Montrer que l’on peut toujours écrire ce système sous la forme : 


Ep = Pp(ti,T2,T3,...,Ln) avec p= 1,2,3,..., N. 
b — Partant de valeurs approchées {219,25 .. „z? } de la racine recherchée, on forme les 
suites récurrentes : 
qlk) =, Care ee L'an) avec p=1,2,...,n. 


On se propose d'étudier la convergence d’un tel processus itératif sur l’ensemble des valeurs 
(k+1) Aa * : ` , . PA 
zp . Pour cela on désigne par x? la solution exacte du système, et l’on note par £; l'écart 
entre la solution et sa valeur approchée au k° tour : 
* — p(k) , 
rj =z; + Ej. 
Après avoir développé la fonction ®p en série de Taylor au premier ordre au voisinage de la 


valeur obtenue au k°®° tour d’itération, donner l'expression de x$ en fonction de Ep et de ses 
dérivées partielles. 


c — L’erreur après la k* itération est définie au moyen de l’expression : 


O0) 


€j 37 T5 


. ce nr - , k+1 . 
Donner l'expression de £; au k° tour d’itération, puis, donner l'expression de ef +) en fonction 


d (k) 
es eg”. 
On peut remarquer que les quantités el") sont les composantes d’un vecteur E%+1), alors 


montrer que E%+1) peut s'écrire sous forme matricielle : 
EUH) = ME. 
On explicitera la matrice M. 


d — Soit EU) le vecteur des erreurs sur les valeurs initiales. Donner l'expression de E+») en 
fonction de EU). 

Quelle condition doit remplir la matrice M pour que le processus soit convergent ? (Application 
contractante). 


e — Dans le cas où la convergence est assurée, proposer une amélioration qui exploite mieux les 
résultats des calculs et qui, par conséquent, augmente la vitesse de convergence de la méthode. 
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4.7. Résolution d'un système non linéaire 


On considère un système non linéaire de deux équations à deux inconnues : 


f(x, y) = 0 
g(x,y) = 0. 


On suppose qu’il existe un domaine A à l’intérieur duquel le système admet une solution et 
une seule ; en outre, on suppose que les fonctions possèdent des dérivées par rapport à x et à y 
jusqu’à l’ordre n inclus, et que les fonctions et leurs dérivées sont continues dans A par rapport 
à x et à y. 

On se propose de calculer la solution (X,Y) en minimisant la forme quadratique suivante : 


p(z, y) — f(z, y) F g’(x, y). 
a — Montrer que ce second problème est équivalent au premier. 


b — On choisit comme première approximation de (X,Y) un point Mo(xo, Yo) appartenant à 
A. Dans un premier temps on considère que yọ ne change pas et l’on se propose de chercher une 
meilleure approximation seulement de xs appelée xı telle que : 


zı = Lo +é. 


Écrire le développement de ®?(zo + £, yo) au deuxième ordre en £ au voisinage de to; puis 
calculer x pour que ®?(x,y) soit minimum. 


c — Maintenant, on maintient xı constant et l’on va calculer par le même procédé une meilleure 
approximation de y appelée yı telle que : 


Yi = Yo +7. 
Donner la valeur de 7. 


d — Comme les développements successifs sont limités au deuxième ordre, les valeurs de & et 
de ņ ne sont que des approximations. Proposer un algorithme qui permet d'atteindre X et Y. 
Comment vérifier que les valeurs calculées sont bien une solution du système proposé? 


4.8. Ordre d'un processus itératif 


Soit f(x) une application de R sur R continue et indéfiniment dérivable. À partir d’une valeur 
zo on génère une suite Tk+1 = f(x). 

Si dans le domaine D l'application est contractante, après un nombre fini d’itérations on 
obtiendra la relation X = f(X) à la précision de la machine utilisée. 

Soit (x) = 0 une fonction dont on désire calculer la racine unique X localisée dans le domaine 
A. Montrer que les recherches de la racine par approximations successives et par la méthode de 
Newton obéissent au schéma fonctionnel que nous avons défini. 

La recherche d’une racine X de l'équation ®(x) = 0 dans le domaine A consiste à associer à 
cette équation une autre équation équivalente x = f(x) où f(x) est une application contractante 
dans A de telle sorte que l’on ait X = f(X). On appelle ex l'erreur après la k° itération et l’on 
pose : 


ek = À + Th, 
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donner l'expression de e, ,1 en fonction de en, de f(x) ainsi que des dérivées de f(x). En déduire 
P: n+ ; 
que en+ı est un polynôme (ou série entière) en en que l’on écrit : 


Ent1 = Qen + Be? +y +... 


On explicitera les coefficients œ, 8 et y en fonction des dérivées de f(x). 

Dans l'hypothèse où l'application est contractante lim, _,, €n = 0, cependant, en calcul 
numérique, on cesse les itérations à l’ordre N (N tours d’itération) et l'erreur ex est finie. Par 
définition, on dira que l’on a affaire à un processus itératif du premier ordre si œ Æ 0 et à un 
processus du deuxième ordre si a = 0 et 8 + 0 et ainsi de suite. On comprend que la convergence 
sera d’autant plus rapide que le processus itératif contractant sera d’ordre plus élevé. 


1. Application à la méthode de Newton — On cherche la racine X de l’équation ®(x) = 0 
dans le domaine A où l’on suppose que la méthode de Newton est convergente. 


a — Rappeler rapidement la méthode de Newton, puis exprimer f(x) en fonction de &(x), et 
calculer enfin les coefficients à et 8 en fonction de &({x) et de ses dérivées. 


b — À quelle condition l'application est-elle contractante? 
2. — Associée à l'équation ®(x) = 0, on considère à présent la formule d’itération suivante : 


a a)l) 
TOUOEMELO) 


où h(x) et g(x) sont des fonctions arbitraires dont on exige seulement la continuité et la 
dérivabilité à un ordre suffisant. 

Ici encore on suppose que (x) a une racine unique dans le domaine A, domaine où 
l'application est contractante. Calculer les coefficients a et 8. 

Quelle est la condition qui permet d’annuler le coefficient 8? Quel sera alors l’ordre du 
processus ? 


f(z) = 


4.9. Résolution d'un système de deux équations à deux inconnues. Méthode de Kacmarz (1937) 
Soit : 


un système de deux équations à deux inconnues. On suppose que les deux fonctions sont 
continues et dérivables (à l’ordre nécessaire) et que dans un domaine D ce système admet 
une solution unique (X,Y). 


1. Cas où le système est linéaire — On écrit alors : 
aıt + biy +&=0 (droite Dı) 
azz + boy +c2 =0 (droite D3). 


Partant d’une approximation Ao(£o, Yo) appartenant au domaine A, on projette perpendicu- 
lairement ce point sur la droite D4, on obtient alors le point Aı de coordonnées (x1, y1). Ensuite 
on projette le point A; sur la droite D: ce qui nous donnera le point Az de coordonnées (£2, y2). 
On poursuit la génération des points A4 jusqu’à ce que l’on ait obtenu la précision souhaitée. 
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a — Donner l'expression des coordonnées zı et yı en fonction de £o, Yo, a1, bı et R1 cette 
dernière quantité étant ainsi définie : R1 = a1x0 + b1Y0 + c1. 


b — Donner l'expression des coordonnées z2 et y2 en fonction de z1, y1, ao, b2 et Rə cette 
dernière quantité étant ainsi définie : Ro = a2t1 + boys + C2. 


2. Cas général — Linéariser le système 


Par ce procédé nous sommes ramené au problème précédent, il suffit de remplacer les 
coefficients a1, a2, b1, b2 et R1, Ro par les nouvelles valeurs fournies par la linéarisation ; donner 
les expressions de a1,a2,b1,b2 et R1, R2 en fonction de f(x,y), g(x,y) et de leurs dérivées 
partielles. 

Donner alors les expressions de £k, Yk en fonction de £k—1, yk_1 puis Txy1, Yk+ı en fonction 
de £k, Yk- 

Donner les expressions des différents coefficients calculés sur exemple suivant : 


f(x, y) = x? + 4y° — 36—0 
glz, y) = x? + y? — 12r +27 — 0 


5. Éléments de calcul matriciel 


5.1. Résolution d'un système linéaire 


Soit un système de n équations à n inconnues. Réaliser un programme permettant la résolution 
de ce système linéaire par la méthode des pivots, puis le transformer en sous-programme. 

Dans le cas où la matrice est mal conditionnée ou encore lorsque son déterminant est voisin 
de zéro, on rencontre des difficultés pour obtenir un résultat raisonnable. Voici une méthode 
permettant éventuellement de se tirer d'affaire. 

On peut soupçonner de tels problèmes quand la permutation de lignes du système linéaire 
fournit des résultats différents les uns des autres et que les troncatures des nombres ne peuvent 
pas directement expliquer. 


a — On calcule une première valeur |A] déterminant par le produit des pivots. Pour obtenir 
une erreur minimum à chaque étape du calcul il faut amener non pas le pivot le plus grand 
(car cela conduit à amener en fin de calcul les pivots les plus petits qui seront entachés d’une 
importante erreur puisque le produit des pivots est une constante...) mais le pivot dont le module 
est le plus proche de ?/|Ab] ce qui conduit à une erreur minimum sur l’ensemble des calculs. 


b — On calcule une seconde valeur À; du déterminant en amenant chaque fois le pivot dont 
le module est le plus proche de ?/|A5]. On répète l’opération jusqu’à ce que l’on obtienne des 
valeurs stables À, et de %/]A,|. 


c — On inverse la matrice (ou l’on résout le système linéaire) en amenant chaque fois le pivot 
dont le module est le plus proche de ?/IA,|. 


d — Réaliser un tel programme. 
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5.2. Système linéaire surdéterminé 


On envisage l'étude d’un système linéaire de n équations à m inconnues avec n > m. Le système 
appelé Sı se présente sous la forme : 


mM 
y GTR +a =0 avec k=1,2,...,n 
j=1 

que l’on écrira en notation matricielle : 


AX =B. 


Au moyen de la méthode des moindres carrés, il s’agit de réduire ce système Sı au système 
Sz appelé système des équations normales, de m équations à m inconnues. 
Montrer que le système des équations normales s'écrit : 


ATAX = ATB 
où AT est la matrice transposée de A. 
Réaliser un programme qui établit le système des équations normales puis qui le résout 


numériquement. 
Étudier les incertitudes qui entachent les résultats du calcul selon le procédé donné page 378. 


5.3. Résolution d’un système linéaire volumineux 


On considère un système linéaire inversible AX = B dans lequel À est une matrice carrée d’ordre 
N. Malheureusement la matrice À est beaucoup trop volumineuse pour tenir dans la mémoire 
centrale du micro-ordinateur dont on dispose. On se propose de fractionner la matrice À et le 
vecteur B respectivement en quatre sous-matrices et deux sous-vecteurs de la manière suivante : 


A À JX Bı 
A3 A4 X| |B 
Montrer que le problème peut se ramener à la résolution des deux systèmes suivants : 
A Xi + AÅ2Xə — Bı (H.2) 
A3 Xı + A4Xo = Bz (H.3) 


et donner les conditions sur l’ordre des matrices pour que de telles équations puissent avoir un 
sens; pour cela on désignera par lı et kı respectivement le nombre de lignes et le nombre de 
colonnes de la matrice A1, lı et kı positifs non nuls strictement inférieurs à N. 

On se propose d'éliminer le vecteur X entre les deux équations (H.2) et (H.3). Donner 
expression de X; tirée de (H.2). En reportant cette expression dans (H.3), donner l’expression 
de Xə. 

Expliquer la méthode à suivre pour calculer effectivement X2. Pour cela on détaillera chacune 
des opérations à réaliser. 

Détailler ensuite la méthode pour obtenir X1. 


5.4. Résolution d’un système linéaire par la méthode itérative de Jacobi 


On considère un système linéaire de n équations à n inconnues que l’on écrit sous la forme 
matricielle usuelle : 


AX = B' 


où À’ est une matrice d’ordre n sur laquelle on fait l'hypothèse qu’elle est non singulière, X le 
vecteur des inconnues à n composantes et B’ le vecteur second membre à n composantes. 
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a — On désire se ramener à un système identique noté : 
AX = B (H.4) 
de telle sorte que l’on puisse décomposer la matrice À en une différence de deux matrices : 
A=I-M (H.5) 


où I est la matrice unité d’ordre n et où M est une matrice d'ordre n n'ayant que des zéros sur 
la diagonale principale. 
Les éléments de A’ sont notés ają, ceux de À notés ax, et ceux de M sont notés mp. 
Montrer que toujours la décomposition proposée est possible dans les conditions de l'énoncé. 
Exprimer les éléments de A en fonction de ceux de A’ puis ceux de M. Donner l’expression des 
éléments b; du vecteur B en fonction des éléments b}, du vecteur B’ et des éléments de 4’. 


b — En remplaçant dans l'équation (H.4) la matrice À par son expression donnée en (H.5), 
montrer que l’on peut générer un processus itératif de valeurs X} de X qui permet effectivement 
de calculer la solution X. On écrira explicitement l'équation matricielle à laquelle ce processus 
obéit. 

Partant du vecteur Xo (dont toutes les composantes sont nulles par exemple), expliciter les 
vecteurs X1, X2, X3,..., Xk, en fonction de I, M et B. 


c — Quelle est la limite Z de Xą quand k tend vers l'infini? Montrer que Z est bien solution 
du problème. 


d — On se propose d'étudier la convergence de la procédure. Montrer que la suite des X4 
converge à condition que MP tende vers zéro quand p tend vers linfini. Quelle propriété doit 
vérifier la matrice M pour qu'il en soit ainsi? 


e — Quand cette dernière condition n’est pas vérifiée, le processus est divergent. Proposer 
néanmoins une procédure qui permette quand même l’obtention de la solution X en exploitant 
les données fournies par l’algorithme divergent. 


5.5. Résolution d'un système linéaire dépendant d’une matrice symétrique 
(méthode de Choleski) 


1. — On considère une matrice carrée À d’ordre n dont les éléments sont notés ax. On suppose 
que cette matrice est régulière (ou non singulière : son déterminant est différent de zéro). On 
décompose cette matrice en un produit de deux matrices triangulaires L et S, L étant triangulaire 
inférieure avec des éléments quelconques sur la diagonale, S étant triangulaire supérieure avec 
des 1 sur la diagonale, de telle sorte que A = LS. On désigne par {y les éléments de L et par 
Sık les éléments de S, mais on ne demande pas de les calculer. 


a — On se propose de résoudre le système linéaire AX = B où B est un vecteur colonne 
donné dont les éléments sont notés b. Montrer qu’il est équivalent de résoudre le système 
SX =L IB=7Y. 


b — Supposons que l’on connaisse les éléments y du vecteur colonne Y. Montrer comment 
calculer directement la solution du système SX = Y. 


c — Maintenant, il s’agit de calculer Y. Écrire explicitement le système B = LY, puis les 
relations entre les éléments y, lpg et br. En déduire la valeur des yx en fonction des lpq, br et 
des ys déjà calculés (s = 1,2,...,(k—1)). 
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d — Montrer que la matrice L peut être rendue triangulaire avec des 1 sur la diagonale en la 
multipliant à droite par une matrice diagonale D71 convenablement choisie. On écrira L = AD. 
Donner l’expression des éléments de A; la matrice À en fonction des éléments l;; de L. Montrer 
que À = LS = (AD})S peut aussi s’écrire (seulement dans ce cas précis) À = A( D8). 


2. — À partir de maintenant on suppose que la matrice À est symétrique : À = AT (AT est la 
matrice transposée de À). 


a — Donner l'expression de AT en fonction de D, ST et AT, en déduire deux relations entre A, 
S, ST et AT. 


b — Déduire que A = ADAT (ou encore que A = ST DS). Comme D est une matrice diagonale, 
on peut écrire : A = AVDVDAT = MMT. Donner les éléments ôy de VD en fonction des 
éléments dpp de D. 


c — Écrire directement les relations donnant les éléments myx de la matrice triangulaire 
inférieure M en fonction des éléments a;; de À. 


d — Indiquer une méthode de résolution des systèmes linéaires dépendant d’une matrice 


symétrique non singulière. 


5.6. Résolution d’un système linéaire par la méthode du gradient conjugué 
On se propose de résoudre un système linéaire de N équations à N inconnues : 
AX =B 


où À est une matrice définie positive et symétrique d'ordre N d’élément ax, X le vecteur 
inconnu, B le vecteur second membre d'éléments {b;}. 


1. — Soient p et q deux vecteurs de dimension N. On note par (p,q) le produit scalaire de p et 
q : (p,q) = p? a, p7 étant le vecteur transposé de p en écriture matricielle. 
Montrer que (p, Aq) = (Ap, q) = (q, Ap) = (Aq, p). 


2. — Par définition, on dit qu’une suite de vecteurs {p;} est A-orthogonale (i = 0,1,...,N — 1) 
quand les produits scalaires (Ap;, p;} sont nuls pour i Æ j. 


a — Montrer que (Api, pi) > 0. 
b - Montrer que les {p;} forment une base de l’espace à N dimensions. 


c — On désigne par h le vecteur qui est solution du système AX = B, montrer que h peut 
s’écrire sous la forme : 


N—1 
h= 5y CjPj, avec Cj = Br). (H.6) 
j=0 (Apj, pj) 


Montrer que h peut s’obtenir par le schéma itératif suivant : 


To = Copo 
ë= (B, p;) 
7 (Api, pi) 


Tj41 = Tj + CjHPj+1 
zm=h ave M <N. 
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3. — On se propose maintenant de construire une base {pp} de vecteurs A-orthogonaux à partir 
d'une base {vp} de N vecteurs linéairement indépendants (orthogonalisation de Gram-Schmidt) 
pour k = 0,1,2,..., N — 1. 


a — On pose po = vo, puis pı = vı + @10P1. 
Montrer que 


P = (Avı, po) 
072 + 
(Apo, po) 
puis que le vecteur pz11 s'exprime en fonction des k précédents vecteurs p de la façon suivante : 
k 
Pk+1 = Uk+1 + Qk+1,0P0 + Qk+1,1P1 + + Ok+1,kPk = Vki + 5 Gk+1,5Dj 
j=0 


avec k<N-—2. (H7) 


Donner l'expression des a@x+1,; en fonction des produits scalaires de vecteurs (connus au fur 
et à mesure). Montrer que 


(vx, Ap;) = 0 pour j >k. 


b — Si A est la matrice unité (A = 1), la suite des vecteurs A-orthogonaux devient une suite de 
vecteurs orthogonaux. Dans ce cas particulier, montrer que la suite des {p}, } dont la définition 
(légèrement modifiée par rapport à (H.7)) est la suivante : 
k—1 
Phai = Ph + 5 VD T Yk+1,kUk+1 
j=0 


est une suite orthogonale que l’on peut écrire sous la forme : 


1 k—1 ! 
4 1 (Pio Pr) (Uk+1, p3) ' 
Pky Pret rs TT nn Pj T VkH p. (H.8) 
LE (Uk+1; Pk) > (pp) 7 
4. — On se propose d'utiliser les résultats précédents pour résoudre le système AX = B. Pour 


cela, il nous suffit de connaître une base quelconque de l’espace de dimension N, à partir de 
celle-ci nous obtiendrons une base {pp} A-orthogonale qui nous permettra de calculer le vecteur 
solution R. 

Cette base {px} A-orthogonale sera déterminée à partir d’une base {r} orthogonale. On 
propose de calculer simultanément — ou en parallèle — les deux bases en procédant de la 
manière suivante : 

Soit zo une approximation arbitraire du vecteur h. On pose : 

Po —=To = B — At 
r2 


Se t 
(pi, Api) 
Ti+1 = Ti + Qipi 


Qi où r? = (riri) 


ri = Ti — a; Åp; 


Be (ri1, Api) 
ù (Pi, Api) 
Pin = Tipi + bipi- 
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N.B. - À chaque étape du processus itératif, r; donne l'écart à la solution exacte et s'appelle 
vecteur résidu ou résidu. 


a — Montrer que la suite des {r;} est orthogonale en utilisant la relation (H.8). On pourra 
poser : 


Uri = Apr et DE =T8x. 
b — Montrer que la suite des {p;} est A-orthogonale en utilisant la relation (H.7). 


c — Quel est le nombre maximum de tours d’itération qui permettra d'obtenir la solution exacte, 
abstraction faite des erreurs dues aux troncatures des calculs effectifs? 


5. — Cette méthode de résolution d’un système linéaire, dépendant d’une matrice A définie 
positive et symétrique, s'appelle méthode du gradient conjugué. 
Les formules 
(B,p;) 
To = Copo AVEC cj = 7 ——— 
4 (Apj, pj) 
Tj = Zj—1 + CjPj 


montrent que l'approximation x; s'obtient à partir de l'approximation précédente en ajoutant 
une quantité algébrique parallèle au vecteur pj. Nous allons voir que, précisément, la quantité 
cp; est celle qui minimise le carré du résidu dans la direction pj. On note E?(x) le carré du 
résidu. 

a — Montrer que E? (x) est donné par l'expression : 


E? (x) = [A(h — z), h — z]. 


Il s’agit de minimiser Æ? (x) dans la direction p sur la droite x = x; + ljpj et de déterminer 
l; correspondant à ce minimum. | 


b — Montrer que E?(x; +l;p;) = E?(x;) + (5(Ap;,p;) — 2l;(r;,p;) expression dans laquelle on 
a posé :r; = B — Az; (= B — zj). 
(rj Pj) 


Déduire que l; = 
(AD, pi) 


c — En remarquant que (r;,p;) = (B — Ax;,p;) = (B, pj) — (£j, Ap;) et que 


j—1 
Tj — X CkPk 
k=0 


déduire que l; = cj. 


6. — Soit À une matrice quelconque. Quelles transformations doit-on appliquer au système 
linéaire pour pouvoir utiliser l’algorithme étudié ? 
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5.7. Calcul direct des coefficients du polynôme caractéristique 


Soit À une matrice carrée d’ordre n dont les éléments sont réels. On se propose de calculer 
directement les coefficients ax de son polynôme caractéristique que l’on peut écrire sous les 
formes suivantes : 


(A) = [Mn — A}, (H.9) 
À) = Sax, (H.10) 
j=0 


où /, est la matrice unité d’ordre n, les crochets signifiant qu’il s’agit d’un déterminant. 


a — Identifier l'expression donnée par (H.10) avec le développement en série de MacLaurin de 
P;()) afin d’expliciter les coefficients ay Due alors l’ nn de a; en fonction de P,(0) 
et des dérivées en zéro qui sont notées PU (0), q = 1,2,. 

Pour obtenir les dérivées successives de Pa (À), on se pronose s dériver lexpression (H.9) par 
rapport à À, puis on fait À = 0 pour obtenir les P®(0). 

Comme A ne dépend pas de À, la règle de dérivation du déterminant donnant P/ (A) dans le 
cas particulier qui nous intéresse est donnée par les expressions suivantes : 


P(A) = AR — A] = Lan- 1— Aÿj 


où /,_1 est la matrice unité d'ordre (n — 1) et où Aj; désigne la matrice d'ordre (n — 1) obtenue 
en supprimant la j° ligne et la j° colonne de la matrice À. 
Donner l'expression de P'(0). 


b — En utilisant la règle de dérivation précédemment fournie, donner l'expression de P”(A), 
puis en déduire l'expression de P/(0) en fonction des matrices Ajj kk qui désignent les matrices 
d'ordre (n — 2) obtenues en supprimant dans la matrice À les lignes j et k d’une part et les 
colonnes j et k d’autre part (on précisera soigneusement les indices). 


c — Montrer que l’expression de PĮ )(0) est donnée par : 


PED (0) = (—1)779 $ [Ajek] = QI) D Ajka 
j,k,...,q i<k,..,<q 


d — Montrer par un examen direct de (H.9) que P? (0) = n! 


e — Dire comment exploiter cet algorithme pour obtenir les valeurs propres de la matrice À. 


5.8. Calcul des valeurs propres d'une matrice réelle et symétrique par la méthode de Jacobi 


a — Soit À une matrice carrée d'ordre n à éléments {ax} réels. On considère une autre matrice 
T d'ordre n à éléments réels {tx} qui possède une matrice inverse T7}. Les valeurs propres {Xi} 
et les vecteurs propres {X;} sont donnés par l'équation : AX = AX. Montrer que B = TAT 
admet les mêmes valeurs propres que A. Pour cela on posera X = TZ, expression dans laquelle 
Z est vecteur propre de B. 
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b - Dans toute la suite du problème on considère que À est une matrice symétrique ars = asr. 
À quelle propriété importante obéissent les valeurs propres de A? 


c — À présent, on cherche à diagonaliser la matrice À au moyen d’une succession de transfor- 
mations T-1AT. 


Choix de la matrice T -— T est une matrice unité d’ordre n à l'exception de quatre éléments 
se situant à l'intersection des lignes p et q d’une part et des colonnes p et q d’autre part : 


tpp = COS(p) tp = Sin(p) tap = Sin(p) tag = — cos( o). 
Montrer que T~! = T. 


d — Écrire les éléments de la matrice (AT). Puis montrer comment ces éléments sont modifiés 
lorsque l’on multiplie (AT) par T-t. Écrire les éléments biy de B = T-!(AT) et en particulier 
bpp» baa» Ppa €t bap- 


e — En déduire que B = T7!AT est une matrice symétrique. (Attention, le produit de deux 
matrices symétriques n’est pas, en général, une matrice symétrique.) 


f — @ est un paramètre que l’on choisit de telle sorte qu’on annule le coefficient bpq et par 
conséquent bp, donner alors l'expression de tan(2ç) en fonction des aix. On pose tan(2@) = 7. 
Donner l'intervalle de variation de y. Donner les expressions de cos(yw) et de sin{w} en fonction 
de 7 en prenant garde aux éventuels problèmes de signe, au préalable, il peut être utile de 
calculer sin(29) ou cos(2ç), et l’on désignera par € le signe de 7. 


g — Définir un algorithme qui amène progressivement des zéros partout hormis sur la diagonale 
principale dans la suite de matrices B; que l’on précisera. Dans le cas où 7 devient infini le 
procédé ne tombe pas pour autant en défaut. Donner alors les valeurs numériques de cos() et 
de sin(y) qui permettent de poursuivre la transformation. 

Convergence de la méthode — Montrer que pour une matrice symétrique telle que À, la somme 
des carrés des valeurs propres de À notée $? est égale à la somme des carrés de tous les éléments 
de À. En déduire que cette valeur est invariante si la matrice subit une série de transformations 


générales du type de celles définies ci-dessus TLAT. 


h — Calculer bpp + bag €t bpp — bag en fonction des azg et de p. De ces deux équations auxquelles 
on joint l’expression de bpq, démontrer que : 


2 JoL? 2 2 
bop + bag = App + Aqq F 2Apar 
i — En déduire que la méthode étudiée est inconditionnellement convergente. 
Quelques expressions utiles... 


cos?(p) — sin? (p) = cos(2), 
2sin(y) cos(s) = sin(24). 
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5.9. Calcul des valeurs propres d'une matrice par la méthode de Souriau (1948) 


Soit À une matrice carrée d’ordre n dont on se propose de calculer les valeurs propres Aj, 
lesquelles sont les racines du polynôme caractéristique : 


P,(x) = aoz” + arl + agt”? +...+a, =0 avec a = 1. 


Nous nous proposons de calculer directement les coefficients ax puis de calculer les racines du 
polynôme. Pour ce faire, considérons une suite de matrices B, définie de la façon suivante : 


B, = AT + a ATT! + aA? +--+ al, 
où I est la matrice unité d'ordre n. 


a — Donner la relation de récurrence qui existe entre deux matrices consécutives B4 et Bk+1- 
Quelle valeur convient-il de donner à Bo? 


b — Démontrer les relations de Newton exprimant les coefficients a; en fonction des sommes 
des racines élevées à la même puissance m. On notera : 


n 
S™ = X Ajm = Tr(A™). 
j=l 
En utilisant lexpression de a; donnée par la relation de Newton, montrer que 
ax = —Tr(AB;_:)/Kk, 


et déduire une procédure générale de calcul des valeurs propres d’une matrice. 


6. L'interpolation 
6.1. Le polynôme de Lagrange 


On dispose d’un fichier de données constitué d’une suite de N couples d’abscisses et d’ordon- 
nées. On désire réaliser un programme qui permette d’effectuer une interpolation voire une 
extrapolation par le polynôme de Lagrange. 


a — Programmer directement la méthode de Lagrange. 


b — Calculer les coefficients du polynôme de Lagrange par inversion de la matrice fournie par 
l'écriture du système linéaire. 


c — Comparer les performances des deux approches du même problème. 


6.2. Les fonctions «spline » 


Réaliser un programme qui effectue les interpolations (des mêmes données) au moyen de 
fonctions «spline » de degré trois. La mise au point terminée, le transformer en sous-programme. 


Applications des § 6.1 et 6.2 — Déduire des études précédentes un ou plusieurs programmes 
qui réalisent la différentiation et l’intégration. 

Quelles sont les difficultés liées à ces méthodes ? 

La différentiation est-elle une opération sûre? 

Laquelle des deux techniques d’interpolation donne les meilleurs résultats? 

Pourquoi ? 
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7. Intégration des équations différentielles dans le champ réel 


7.1. Étude d’un pendule de longueur variable 


On considère un pendule dont la longueur l varie linéairement avec le temps selon la loi : 
l = lo + vt où v est une constante. 


a — Écrire l'équation différentielle à laquelle obéit langle 8 que fait le pendule avec la verticale, 
sachant que ce pendule est soumis à l’action de la pesanteur dont l'intensité est g. 


b — Écrire l'équation dans le cas où g est petit. Réaliser un programme qui effectue la tabulation 
de la solution de cette dernière équation, sachant que le pendule qui nous préoccupe est la 
benne d’une grue suspendue au bout d’un câble de longueur lo = 10 m. Au temps t = 0, 
8 = x/200 radian, d80/ dt = 0 radian/s et v = 1 m/s. 


c — La benne s’arrête quand elle a parcouru 7 m verticalement (lı = 3 m). Quelle est alors 
l'amplitude des oscillations? Peut-on considérer que 0 est resté petit? 


d — Mêmes questions qu’au § c avec toutefois des conditions initiales différentes : lọ = 3 m, 
l = 10 m, v = —1 m/s, 8 et 0’ gardant les mêmes valeurs. 
7.2. Système électromécanique dépendant d'une équation de Mathieu 


On considère un circuit électrique fermé constitué d’une self L, d’une résistance R et d’une 
capacité C, tous les trois montés en série. L et R sont fixes, en revanche, la capacité C varie en 
fonction du temps selon la loi : 


1 B l+esinuit 
CL Co 


La réalisation de ce condensateur est simple : il est constitué de deux plaques parallèles 
séparées par une distance e(t) qui varie au cours du temps à la fréquence uw1/27 selon 
l'expression : e(t) = eo(l + esinwt) avec la valeur absolue de € plus petite que l’unité. Ce 
mouvement des plaques est évidemment créé par un moteur qui peut donc fournir de l'énergie 
au circuit électrique. 

Écrire l'équation différentielle à laquelle obéit la charge électrique q(t). Intégrer numérique- 
ment cette équation avec les valeurs suivantes : L = 1 H, R = 1 Q, Co = 1074 F, £ = 0,57 et 
w = 225 871, 

Au temps t = 0, qo = 10 4 Cet i = dq/ dt = 0 A. 


7.3. L'équation de Van der Pol 


Soit équation différentielle suivante : 


d?y 
dt? 


2e(1 — 4°) 


On donne € = 1,0. Intégrer numériquement cette équation en choisissant des conditions initiales 
très différentes (ce sont des données qui sont communiquées en conversationnel). 

Représenter les résultats de l'intégration dans l’espace des phases, c’est-à-dire dans l’espace 
où y est porté en abscisse et dy/ dt en ordonnée. On essayera les valeurs € = 1,0 et € = 10,0. 
Qu’observez-vous? Quel intérêt y a-t-il à fréquenter de telles équations? 
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7.4. Intégration d’une équation différentielle du premier ordre par une méthode itérative 
(prédiction-correction) 


Soit à intégrer numériquement l’équation différentielle suivante : 
dy/ dz = f(x,y) pour x appartenant à (a, b). 
De plus, on désire que la solution prenne la valeur yọ pour la valeur zọ = a de la variable. 
a — Rappeler dans quelles conditions il existe une solution unique y(x) à l’équation différentielle. 


b — Par la suite, on supposera que les conditions énoncées au § a sont satisfaites, et l’on 
désignera par h le pas d'intégration de la variable x et par ym la valeur de la solution au 
point £m =a + mh. 

Soit D la droite tangente en (£m, Ym) à la courbe y(x). On procède à une interpolation 
parabolique de y{x) sur l'intervalle (£m-1, £m+1), la sécante passant par (£m-1,Ym-—1), €t 
(£m+1, Ym+1) est donc parallèle à la tangente en (£m, Ym), donner alors l'expression de Ym+1- 


c — Cette relation appelée prédiction montre que le calcul de ym exige la connaissance des 
valeurs des deux points précédents, et l’on ne peut pas calculer la valeur de yı par ce procédé. 
Dans ce cas, on utilisera la formule de Runge et Kutta pour calculer y1. Donner l'expression 
de yi. 


d — Hormis yı, nous allons améliorer la précision de chaque ym+1ı en utilisant une formule 
itérative appelée correction. On désigne alors par y}, 41 la valeur calculée au § b et par yE, 41 la k° 
valeur itérée. Pour calculer la valeur y2,}1, on considère qu’elle est déterminée par l'intersection 
de la droite Q et de la droite x = £m4+1 ; la droite Q est construite de la manière suivante : elle 
passe par le point (£m, Ym) et sa pente est la moyenne arithmétique de la pente de y(x) calculée 
en (£m, Ym) et de la pente calculée en (zm2+1,Y4,:1). Donner l'expression de yf 4- 


e — Quel critère pourra-t-on retenir pour limiter les itérations ? 


f — La méthode proposée converge lorsque h < 2/M, où M = suplôf/ôx| dans le voisinage du 
point où l’on effectue les calculs. Comment s'affranchir de cette contrainte? 


g — Après avoir transformé l'équation différentielle sous une forme intégrale sur les intervalles 
définis pour la formule de prédiction et pour la formule de correction, donner les expressions de 
l'erreur de la prédiction et de la correction. On pourra effectuer un développement analogue à 
celui qui à été réalisé lors de l’étude des méthodes des trapèzes et de Simpson. 


7.5. Étude d'un phénomène transitoire obéissant à une équation différentielle du premier ordre 


Si la constante de temps est faible devant l’unité, alors bien avant l’unité, la solution présentera 
de faibles variations donnant l'illusion d’un phénomène régit par une grande constante de temps. 
L'intégration numérique peut alors poser quelques problèmes. 


1. Position du problème — Soit l'équation différentielle suivante : 


d 
= = —50y +5 avec y(0) = 0,20. (H.11) 
z 
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a — Montrer que la solution formelle peut se mettre sous la forme : 
y(t) = 0,1[1 + exp(—-50t)|]. (H.12) 


Déterminer l'intervalle de variation de y(t) quand t appartient à (0 ; o0), puis représenter 
graphiquement cette solution. 


b — Calculer par la méthode d’Euler les valeurs numériques y(1) et y(2) (respectivement pour 
les valeurs tı = 1 et t2 = 2) avec un pas d'intégration h = 0,05. Comparer avec le calcul direct 
de l'expression (H.12). 

Que suggérez-vous pour obtenir des valeurs numériques plus conformes à celles obtenues à 
l’aide de la relation (H.12)? 


2. Étude d'une méthode de résolution spécifique — On considère une équation un peu plus 
générale, soit : 


dy 
dx 


où s(t) représente une fonction continue à variations faibles (lentes) sur (0, co). 


= —Dy + s(t) avec D SI. (H.13) 


a — En multipliant les deux membres de (H.13) par exp(—D - t) puis en intégrant entre tı et 
t2, montrer que l'équation (H.13) peut se mettre sous forme d’une équation intégrale qui est 
équivalente : 


t2 


y(t2) = y(tı) expl- D(t2 — tı)] + Jovine — t2)s(t)] dt (H.14) 


ti 


b — L'intégrale figurant dans (H.14), désignée par I, peut être calculée d’une manière approchée 
par le procédé suivant : si s(t} est développable en série entière, on obtient approximation en 
tronquant le développement à l’ordre N ; 


N 
s(t) =J tbr; 
k=0 
qu’il sera plus habile d’écrire (l'intérêt apparaîtra plus loin...) : 

N 

(t-t)" 
s(t) =) k ar; 
lyk 
= k'u 


en posant u = t2 — tı. 
Montrer que J peut être approchée par l'expression : 


N 
T= >» Cyar. 
k=0 


Donner l'expression de Co, puis la relation de récurrence entre deux valeurs consécutives C4 
et Ck+ı. (Intégration de Cp par parties.) 


Choix des points de calcul — Il est commode de choisir les points en progression arithmétique : 


Tw-x =t2— ku avec k —0,1,...,N. 
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Étude du cas N = 1 — Calculer les points Tọ et T1, puis les valeurs są = s(T%) en fonction des 
aj. Exprimer les a; en fonction des s. Donner alors l'expression de y(T1) en fonction des C; 
et 8;. 


Application numérique — En conservant le pas h = 0,05, calculer y(1) et y(2) de l’équation 
différentielle (H.11). 


Étude du cas N = 2 — Calculer les points To, T} et Tù, puis les valeurs sx = s(T;) en fonction 
des a;. Inverser ces relations pour obtenir les a; en fonction des sj. Donner l'expression de y(T2) 
en fonction des C; et sj. 


3. Généralisation de l'équation (H.13) - On considère à présent que s(t) dépend de y(t) et 
l’on écrira : 


s(t) = s[y(t), t]. 


L'équation (H.13) n’est évidemment plus linéaire, mais on supposera encore que s[y(t); t] 
est une fonction à variations lentes et faibles. Rien du développement formel précédemment 
réalisé n’est modifié, seul le calcul de l'intégrale demandera le calcul explicite de s[y(t);t], car 
les coefficients ax dépendent des valeurs obtenues pour les y(T;). 

Écrire explicitement l'expression donnant y(11) à partir de la formule obtenue pour N = 1. 
Indiquer un procédé pour obtenir effectivement y(T1) en fonction de y(To) = y(0). 

Connaissant à présent y(T5) et y(T1), donner la formule exprimant y(T2) à partir de 
l'expression obtenue pour N = 2. Puis indiquer un procédé permettant de calculer effectivement 
y(T2). 

Décrire une procédure complète d'intégration de la dernière équation différentielle proposée. 


Application numérique — Soit l'équation : dy = —50y + EA avec y(0) = 0,2. Calculer y(h) et 
y(2h) avec h = 0,05. 


7.6. Problème de la poursuite 


Un jardinier tourne à la vitesse constante de 6 km/h autour d’un parterre dont la forme est une 
ellipse de grand axe 2b = 20 m et de petit axe 2a = 12 m. Lorsqu'il est en À, son chien est en B 
et court à sa rencontre de telle sorte que le vecteur vitesse du chien passe à chaque instant par 
le point où se trouve le jardinier. Le chien court à la vitesse constante de 20 km/h. Sachant que 
la distance OB = 30 m et que le chien a le droit de piétiner le parterre, trouver la trajectoire 
du chien et représenter la graphiquement (cf. Fig. H.1, page suivante). 

Trouver, au besoin expérimentalement, des conditions initiales de ce problème pour lesquelles 
le chien ne rattrape pas le jardinier. Tracer dans ce cas le cycle limite de la trajectoire suivie 
par le chien. 


8. Intégration des équations aux dérivées partielles 


8.1. L'équation de Laplace, les isothermes d’un réfrigérateur 


Nous nous proposons de déterminer dans le plan les isothermes d’un réfrigérateur à l'équilibre 
thermique, c’est-à-dire quand OT /ôt = 0, expression dans laquelle T représente la température 
et t le temps (cf. Fig. H.2, page suivante). 
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Figure H.1. Problème de poursuite. 


La géométrie du réfrigérateur est donnée sur la figure H.2 : le congélateur est représenté par un 
rectangle à la température de —10 °C, en revanche, la paroi du réfrigérateur est à la température 
ambiante de 20 °C. 


80 cm 


Figure H.2. fsothermes d'un réfrigérateur. 


Procéder à un maillage convenable du domaine, calculer la température en chaque point du 
maillage et déterminer quelques isothermes de ce système thermique. 
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8.2. Refroidissement d’une sphère homogène 


Une sphère homogène de cuivre de rayon r = 5 cm est portée à la température uniforme ĝo = 
90 °C. Au temps t = 0, elle est plongée dans un grand réservoir d’eau à la température uniforme 
01 = 10 °C. On considère que ce réservoir est un excellent thermostat. On demande de calculer 
la température dans la sphère à différents instants. On dit que la sphère est complètement 
refroidie lorsque son centre est à une température inférieure à 10,1 °C. Déterminer la durée du 
refroidissement. On donne le coefficient de diffusion dans le cuivre D = 1,12 cm?/s. 

N.B. - Attention à l'usage des coordonnées sphériques que nous emploierons de toute façon, 
mais en r = 0 les équations sont discontinues. Comment pallier cet inconvénient ? 


8.3. Cas où tout le volume est le siège d'un dégagement de chaleur 


Si tout le volume est le siège d’un dégagement de chaleur, montrer que l’équation de la chaleur 
s'écrit : 


p p ôt’ 
où P est la puissance dissipée par unité de volume, p est la capacité calorifique par unité de 
volume et À est la conductibilité thermique du milieu. 

Un cylindre de cuivre de longueur indéfinie, de rayon R = 1 cm, est parcouru par un courant I. 
La résistivité du cuivre est r(T) = ro(1 + aT), où ro = 1,721078 Q m, T est exprimé en °C et 
a =4,1(°C) 1. On donne p = 3,40 Jem * et D = £ = 1,12 em ?s-!. On plonge ce fil dans un 
bain (thermostat) à la température de 10 °C, on attend que le fil soit en équilibre thermique, 
ensuite on fait passer un courant continu réparti uniformément d'intensité I = 200 A. 

Après avoir montré que P = r(T)j? avec j = r déterminer le profil de température de 
seconde en seconde dans une section du fil. 


9. Les transformées de Fourier 


9.1. L'algorithme de Cooley- Tuckey 


Réaliser le programme de la transformée de Fourier directe et de la transformée de Fourier 
inverse. 
On commencera par réaliser des programmes de mise au point qui sont : 


a. la table des adresses permettant de mettre les données dans le bon ordre ; 
b. la table des sinus (et cosinus) au moyen d’un algorithme récurrent ; 
c. la transformée de Fourier par décimation. 


On pourra tester les deux transformées de Fourier sur une gaussienne tronquée (il faut 
réfléchir sur la troncature...). La transformée inverse doit permettre d'obtenir les valeurs de 
départ, éventuellement entachées d’une petite erreur, déphasées de 7 selon le choix retenu pour 
représenter les données. 

Transformée de Fourier de la fonction porte. 

Transformée de Fourier d’un réseau (taches de diffraction). 
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9.2. Étude d’un vélocimètre 


On se propose d'étudier un dispositif permettant de mesurer la vitesse d'écoulement laminaire 
d’un fluide, ou plus exactement la vitesse de très fines particules en suspension dans un liquide. 

Le liquide s'écoule dans un tube cylindrique transparent au sein duquel on projette l’image 
d’une plaque opaque dans laquelle il y a N trous de diamètre a disposés sur une droite selon 
une progression arithmétique de raison b. L'image de l’axe portant les trous est parallèle à l’axe 
du cylindre contenant le fluide (cf. Fig. H.3). 


Canalisation de 
l'écoulement 


Cellule 


Réseau Objectif 


Lampe et 
condensateur 


Figure H.3. Étude d’un vélocimètre. 


Pour des raisons de commodité, on supposera que l’image a le grandissement 1 en valeur 
absolue. Notons que la plaque trouée peut être avantageusement remplacée par une diapositive 
sombre dans laquelle des points blancs jouent le rôle des trous. On éclaire le système avec une 
lampe alimentée en courant continu afin d'éviter les modulations parasites dues au courant 
sinusoïdal. 

En l'absence de suspension, l'intensité reçue par la cellule photoélectrique est constante et 
égale à Io. Le passage d’une particule G devant les trous va provoquer l’absorption de lumière. 
On appelle v la vitesse de la particule dont on supposera que la taille est négligeable devant la 
taille des trous. 

Montrer que l'intensité absorbée Ia (t) peut être représentée par la figure H.4, page ci-contre. 

On donnera les valeurs de a et B portés sur la figure H.4, page ci-contre, en fonction des 
paramètres précédemment définis. Ensuite, on calculera formellement J(v) la transformée de 
Fourier de 1,(t). Représenter alors J(v), soit en tabulant la fonction J(v), soit en calculant 
numériquement la TF de I(t) pour un nombre de trous donnés, de dimension et d’espacement 
donnés. L’allure de la courbe est donnée figure H.5, page ci-contre. 


a — Donner les expressions des quantités À, B et C portées par cette figure. 
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L(t) 


Figure H.4. O q B t 


Figure H.5. 


b — Comment concevez-vous l’appareillage du cadre « mesure » chargée du traitement du 
signal ? 

Le parallélisme entre l’axe des trous et l’axe de déplacement des particules G doit être 
rigoureux. Comment réaliser cette opération à l’aide du dispositif et de l’appareillage utilisés? 

Dans la réalité, le nombre de grains G est très élevé, et l’on recueillera sur la cellule 
photoélectrique un signal formé de la superposition de signaux tels que celui présenté figure H.4, 
mais déphasé d’une façon aléatoire les uns par rapport aux autres. Dire pourquoi l’allure générale 
de J(v) ne sera pas modifiée. 


9.3. Calcul numérique des transformées de Fourier pour un nombre de données N = b° 


Soit f(x) une fonction appartenant à L?, et l’on désigne par y(t) sa transformée de Fourier. 
On ne considère par la suite que les fonctions échantillonnées normalisées. Pour chacune des 
fonctions, on dispose de N échantillons complexes (uniformément répartis) notés f et Yx avec 
(k,m) = 0,1,2,...,N — 1. Au besoin, on peut écrire fm = fh, + jf}, et Yk = pk + jyh. 

La transformée de Fourier discrète s’écrit : 


LE 27 
a km : g 
Pk = N >, ÍmnWy avec Wy = exp ( +) 
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On suppose que N est une puissance de trois : N = 3°. Montrer que y, est une combinaison 
linéaire de trois transformées de Fourier comprenant chacune N/3 échantillons ; soit : 


1 
Pk = zlá + BWE + Ck WF], 


on explicitera Ap Bpk et Cr. 

Montrer que les transformées de Fourier Ag, Bk et Ck peuvent être calculées par le même 
procédé et ainsi de suite. 

On suppose s = 2. Donner l’ordre dans lequel doivent être disposées les données pour mener 
à bien le calcul utilisant cet algorithme. 

Dans le cas où N = 2° nous savons que la donnée n° k doit être déplacée au rang j, valeur 
qui est donnée par : 


N 
j = Ry(k) = Ry(k = 2°) + zgr avec 2° <k < 2+1 et Rnw(0) = 0. 
Montrer comment doit être modifiée cette relation pour l’adapter au cas N = 3%. Vérifier sur 
l'exemple N = 9 la validité de la relation proposée. 
Montrer comment on peut généraliser ce procédé de calcul des transformées de Fourier au cas 
où N = b° où b est un entier positif supérieur à 1. 


10. Introduction aux méthodes de Monte-Carlo 


Générateur de nombres pseudo-aléatoires 


Réaliser un générateur de nombres pseudo-aléatoires à distribution rectangulaire (ou uniforme) 
selon le procédé de Lehmer. Tester ce générateur. 

Réaliser un générateur de nombres pseudo-aléatoires à distribution gaussienne en usant du 
théorème central limite. 

Cette dernière façon de procéder peut être médiocre si les queues de distribution jouent un 
rôle important. On préférera : 


m = y (—2l0ge £1) cos(2ré2) 
no = y (—2 loge 1) sin(2Té2) 


£1 et é étant des nombres pseudo-aléatoires indépendants, à distribution rectangulaire et 
appartenant à (0,1). Tester ce procédé. 

Comment obtenir des nombres pseudo-aléatoires indépendants et gaussiens de moyenne 
donnée m et d'écart type o? 


a — Calculer x par une méthode de Monte-Carlo. 
b — Calculer quelques intégrales définies par une méthode de Monte-Carlo. 
c — Résoudre localement léquation de Laplace par une méthode de Monte-Carlo. On reprendra 


le problème concernant le calcul des isothermes d’un réfrigérateur et Pon comparera les différents 
résultats (exercice du chapitre 14). 
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11. Éléments de calcul des probabilités 


11.1. L'ordre statistique 


On considère un vecteur V dont les n composantes £; sont des nombres aléatoires indépendants 
obéissant tous à la même répartition continue F(x) (distribution f(x)). 
On effectue un classement de ces composantes selon les valeurs croissantes que l’on note : 


r <a <... <M, 


z est la plus petite des valeurs £; et z® la plus grande. On admet que les inégalités sont 
strictes en probabilité car F(x) est continue. 

On dispose de n urnes numérotées de 1 à n, et l’on place chacune des valeurs 2) dans l’urne 
k correspondant au rang k attribué par le classement. z est une variable aléatoire. 

On effectue le tirage des composantes d’un nombre de vecteurs V aussi grand que l’on veut, 
toutes les composantes de tous les vecteurs étant des variables aléatoires indépendantes de 
même répartition F(x). Pour chaque vecteur V on effectue le classement puis le remplissage des 
n urnes. On se propose d'étudier la statistique des éléments contenus dans chacune des urnes, 


et plus précisément leur distribution. 


a — On désigne par N,(x) le nombre de composantes £; du vecteur V qui sont inférieures à 
un nombre donné g qui appartient à (—oo, +00). Montrer que S, (x) = N,(x)/n est la fonction 
de répartition des variables e, pour cela on explicite les intervalles de définition de x pour 
les diverses valeurs discrètes susceptibles d’être prises par S,(x). On note que, pour x fixé, 
n = Sh(x) est une variable aléatoire car si les valeurs prises par $,(æ) sont connues, on ne sait 
pan pour quelles valeurs de x ces valeurs sont prises. S(x) s'appelle répartition empirique des 
n 
Th 


b ~ Donner, en fonction de F(x), l'expression de la probabilité P(£4 < x), c'est-à-dire la 
probabilité que la composante £x soit inférieure au nombre x évoqué au § a. Puis montrer que 
P(Ek < x) = constante = p, quelle que soit la composante d'indice k (k = 1,2,...,n). 


c — On se propose de calculer la probabilité que $, (x) prenne l’une des valeurs possibles, soit 
m/n, donner son expression en fonction de F(x) (ou p); pour cela, on remarque qu'il doit y 
avoir m composantes du vecteur V qui sont inférieures à x (éventuellement une égale à x) et 
(n — m) qui sont supérieures à x. On justifiera l’usage de la loi binomiale. ` 


d — À présent, on s'intéresse à la distribution de la variable aléatoire got c’est-à-dire de tous 


les &; (de chaque vecteur V) tombés dans lurne j. On désigne par DV (x) la probabilité que 
g soit inférieur à un nombre g, c'est-à-dire Piet < à): 

L'événement E(xt < x) a lieu quand au moins j composantes de V sont inférieures à x. 
Montrer que l'événement E (S,(x) n’est pas plus petit que À) est équivalent à l'événement 
E(z™ < x). En déduire que a(x) = m=i P{Sn(x) = ©], puis donner l'expression de 


(x) en fonction de F(x). 
e — Montrer que : 


F(x) 


n! j—1 n—j 
Lena pi re 
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pour ce faire, on réalise une succession d’intégrations par parties de cette dernière expression. 


En déduire la fonction de distribution Je (x) de la variable x appartenant à lurne j, puis 


donner l'expression de la valeur moyenne (xt) des é; de chaque vecteur V qui sont tombés 


j 
dans lurne j. 
Application numérique — La fonction F(x) est la loi uniforme : 


0 pour x < 0, 
F(x)= 4x pour 0<z<1, 
1 pour æ>l1. 


et l’on s'intéresse à la statistique d’ordre n = 5 (il y a 5 urnes). Donner l'expression de la densité 
de probabilité, puis calculer la valeur moyenne des é; tombés dans chacune des urnes. Vérifier 
que les résultats sont symétriques. 


12. Lois (Binomiale, Poisson, Gauss-Laplace) 


12.1. La loi Binomiale 


Approximation de n! au moyen de l’approximation de Stirling : log,.(n!) = nlog,(n) — n. 
Application numérique : calculer n! pour n = 50 puis 60, 70, 80, 90 et 100. Quelle erreur 
est commise sur ces approximations ? 

Approximation de n! au moyen de la formule de Stirling : 


n!=n"exp(-n)V2rn(1 + En) 
avec NEn —> 1/12 quand n croît indéfiniment. Reprendre les calculs précédents. 


12.2. La loi de Gauss-Laplace 


Effectuer un sous-programme qui réalise le calcul des trois intégrales suivantes : 


f(z)= 2 fe (5) dt 
0 


g(x) = 1,0 — f(x) 


12.3. Loi du x? 


Effectuer un sous-programme qui réalise le calcul du x? à m degrés de liberté : 


T 


1 u 
Lya (m/2)—1 a 
Ln(z) TOLJ fe exp ( =) du 
0 
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avec 


12.4. Loi de Student 


Effectuer un sous-programme qui réalise le calcul de la loi de Student à m degrés de liberté : 


m +1 > ol 
TaS (1%) A 


12.5. Loi de Poisson 


Effectuer un sous-programme qui réalise le calcul de la loi de Poisson : 


DL 
P; = H exp(—)). 


On donne À = 30, par quelle courbe de Gauss peut-on approcher cette loi? Donner le sup du 
module de la différence entre ces deux fonctions. 


12.6. Loi de Poisson. Distribution de Cauchy 
On considère la variable aléatoire £ obéissant à la loi de distribution 
p(x) = kexp —-alx| pour x appartenant à (—o0; +00) 


expression dans laquelle a est un paramètre strictement positif et k une constante de normali- 
sation. 


a — Calculer la constante k. 


b — Rappeler la définition de la fonction caractéristique @(t) de la variable aléatoire € et donner 
l'intervalle de définition de cette fonction. Calculer effectivement ¢(t). 


c — Calculer la moyenne m ainsi que l’écart quadratique moyen D de la variable aléatoire £. 


d — Rappeler l'expression de la distribution {(m,x) de Student à m degrés de liberté d’une 
variable aléatoire ņ et donner son expression dans le cas où m = 1; on désignera par q(x) cette 
distribution particulière. 


e — Donner l’expression ®(t) de la fonction caractéristique de la variable aléatoire 7. 


f — Soit z = D ni la moyenne arithmétique de n variables aléatoires 7x. indépendantes et 
distribuées chacune selon la loi q(x). Donner l'expression de la fonction caractéristique Y(t) de 
la variable z, puis en déduire sa fonction de distribution. 


473 


MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ 


g — Calculer l'espérance mathématique M de la variable aléatoire z. Que concluez-vous ? 


Quelques résultats utiles — La transformée de Fourier 
+oo 
(t) = J f{æ)exp(2rjxt) dz. 


12.7. Loi binomiale négative. Loi de Poisson dont le paramètre suit une loi du x2. 
Urne de Pólya (1887-1985) 


Ce problème est constitué de trois parties notées 1, 2 et 3 dont les débuts sont indépendants 
les uns des autres, les symboles et notations utilisés sont également indépendants dans ces trois 
parties. 


1. — Une urne contient P boules blanches et Q boules noires (P et Q strictement positifs). On 
effectue dans cette urne des tirages non exhaustifs, c’est-à-dire que l’on procède à la remise dans 
Purne de la boule tirée avant d’effectuer un autre tirage. On note p la probabilité de tirer une 
boule blanche et q celle de tirée une boule noire (p + q = 1). On appelle succès le tirage d’une 
boule blanche et échec le tirage d’une boule noire. 

On s'intéresse aux suites de n tirages notées S7 telles qu’un n° tirage fournisse le r° succès qui 
clôt la suite, r étant un nombre entier positif fixé à l’avance. Pour cela, on poursuit l'expérience 
aussi loin qu’il le faut, n étant aussi grand que l’on veut. Les suites S7 se terminent toutes par 
un succès qui est le rê. Comme n > r, il est préférable d'écrire n = r + k avec k = 0,1,2,... 


a — On note f(k,r,p) la probabilité que le r° succès ait lieu au tirage r + k. Au cours des r + k 
tirages, montrer que la probabilité d’avoir tiré exactement k échecs qui précèdent le tirage du 
r° succès est aussi f(k,r,p). 


b — On appelle événement A la réalisation du r° succès au tirage r + k, événement B la 
réalisation de k échecs au tirage r + k — 1, et enfin l’événement C la réalisation d’un succès 
au tirage r + k. Écrire la relation entre les événements A, B et C. Calculer la probabilité de la 
réalisation de l'événement B en fonction de r, k, p et q. 


c — Donner l’expression de f(k,r,p). Montrer que f{k,r,p) est le coefficient d’ordre k du 
développement de la fonction : p'(1 — g) ". En déduire que D, f(k,r,p) = 1. 


d — Plus généralement, pour un réel r > 0 fixé et pour 0 < p < 1, la séquence {f(k,r,p)} avec 
k =0,1,2,... est appelée distribution binomiale négative. 

Montrer que p” (1 — qt)” est la fonction génératrice des moments non centrés. Calculer mı la 
moyenne de la variable aléatoire entière 4 qui suit la distribution f(k,r,p), puis m2 le moment 
du deuxième ordre. En déduire la variance o?. Comparer ces résultats à ceux de la loi binomiale. 


e — Donner l’expression de la fonction caractéristique y(t) associée à la fonction f. 
2. a — On considère une variable aléatoire € qui obéit à la loi de Poisson de paramètre À. 


Rappeler ce que représente le paramètre À, puis donner la probabilité P; pour que k événements 
soient réalisés. - 
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b - En réalité, À est une variable aléatoire qui suit une loi du x? dont l'expression s'écrit : 


QY 


g(z) = To) 


Y 


r” ~t exp(—az) avec x > 0. 


Vérifier que g(x) est bien une densité de probabilité. Calculer la probabilité (£ = k) que la 
variable aléatoire de Poisson soit égale à une valeur entière positive donnée k. En déduire que 
la variable obéit à une loi binomiale négative. 


3. — On considère une urne qui contient b boules noires et r boules rouges. Après chaque tirage 
effectué, on remet dans l’urne la boule tirée plus c boules de la même couleur. (Il s’agit d’un 
tirage contagieux dans une urne de Pélya.) 


a — Donner l'expression de la probabilité Il,» de tirer d’abord nı boules noires puis ng boules 
rouges. Montrer que, quel que soit l’ordre fixé du tirage de nı boules noires et de n2 boules rouges, 
la probabilité est toujours la même et vaut Il,,».. 


b — Donner l'expression de la probabilité P(n1,n) de tirer nı boules noires parmi n tirages. 


c — On pose : 


b c 
P= Fr 1T pyr j VTT Fr 
Montrer que 
ni n2 
P(r,n) = 2 -4/7 
—1/7 


d — Lorsque n — œ% et que p et y tendent vers zéro de telle sorte que : 
np —> À et ny — -—, 
montrer que la distribution asymptotique étudiée tend vers la loi binomiale négative : 


p pà 1 ni 
P(n, n) — CH g 
P\l1+p l+p 


Pour cela, on montrera que 


nı 
—p° 


ré 


ph? C 


que 


Cie + cina +p)", 


C y + P r: 
C ijy 1+p 


et enfin que : 
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Quelques résultats utiles — Coefficient du binôme, n est un entier positif : 


nin—1)..(n-k+1) 
k! 
n! n 
== ) 
7 % pin=p)!) \p 
Coefficient du binôme généralisé, œ est un réel quelconque positif : 


(1+2) =1+nr+ -+ +o tat = Y CËz* 
k=0 


CRE ET D CR EU POP QU, 


œ 
k! rs 
= vor = 5 aa 
k=0 k=0 
(—-x) *=1+ax+ + SGH GTE Dex =X CE, (-2)° 
: k=0 


n2 


1 i 
y — log (1 + yn 
Dre : ge(1 + yn) 


quand ng est très grand devant l'unité. 


12.8. La loi binomiale négative (reprise et applications) 


Une urne contient P boules blanches et Q boules noires (P et Q strictement positifs). On effectue 
dans cette urne des tirages non exhaustifs, c’est-à-dire que l’on procède à la remise dans lurne 
de la boule tirée avant d'effectuer un autre tirage. On note p la probabilité de tirer une boule 
blanche et q celle de tirer une boule noire (p + q = 1). On appelle succès le tirage d’une boule 
blanche et échec le tirage d’une boule noire. 

On s'intéresse aux suites de n tirages notées §7 telles qu'un n° tirage fournisse le r° succès qui 
clôt la suite, r étant un nombre entier positif fixé à l’avance. Pour cela, on poursuit l’expérience 
aussi loin qu'il le faut, n étant aussi grand que l’on veut. Les suites S7 se terminent toutes par 
un succès qui est le r°. Comme n > r, il est préférable d'écrire n = r + k avec k = 0,1,2,... 


a — On note f(k,r,p) la probabilité que le r° succès ait lieu au tirage r + k. Au cours des r + k 
tirages, montrer que la probabilité d’avoir tiré exactement k échecs qui précèdent le tirage du 
r succès est aussi f(k, r, p). 


b — On appelle événement A la réalisation du r° succès au tirage r + k, événement B la 
réalisation de k échecs au tirage r + k — 1, et enfin l'événement C la réalisation d’un succès 
au tirage r + k. Écrire la relation entre les événements À, B et C. Calculer la probabilité de la 
réalisation de l’événement B en fonction de r, k, p et q. 
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c — Donner l'expression de f(k,r, p). 


d — Plus généralement, pour un réel r > 0 fixé et pour 0 < p < 1, la séquence {f{k,r,p)} avec 
k = 0,1,2,... est appelée distribution binomiale négative. 

On montre que p"(1 — qt)" est la fonction génératrice des moments non centrés. À l’aide de 
cette fonction génératrice, calculer mı la moyenne de la variable aléatoire entière y; qui suit la 


distribution f(k,r, p), puis m2 le moment du deuxième ordre. En déduire la variance o°. 


e — Sur six pommiers d’un verger tirés au hasard, on a prélevé sur chacun 25 feuilles toujours 
au hasard, puis, on a dénombré les mites rouges sur chacune des feuilles. Les résultats obtenus 
sont présentés dans le tableau H.1 d’après C.I. Bliss, Fitting the negative binomial distribution 
to biological data, Biometrics, juin 1953 p. 176. 


Tableau H.1. 

Nombre de mites Nombre de feuilles 
par feuille observées 
0 70 
1 38 
2 17 
3 10 
4 9 
5 3 
6 2 
7 1 

8 et plus 0 


Calculer la moyenne Me et l'écart type a? de cette distribution expérimentale. 
f — Pour rendre compte de cette distribution expérimentale, on envisage l'hypothèse d’une 
distribution de Poisson de paramètre À. Donner la valeur de À. Calculer les différents P4 puis le 
x? correspondant. Peut-on retenir l'hypothèse d’une distribution de Poisson? 
g — On fait l'hypothèse que la loi expérimentale est la loi binomiale négative. Calculer r, p et 
q précédemment définis. Puis calculer la probabilité théorique que le nombre de mites sur les 
feuilles soit m = 0,1,2,...,7. 


h — Calculer le x? correspondant. Peut-on retenir cette dernière hypothèse? 


Quelques résultats utiles — Coefficient du binôme, n est un entier positif : 


nin—1)-.-(n—-k+1) su z= Ÿ Chr 


n—]4 [iaia 
(+z) l+net. + x 


MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ 


Coefficient du binôme généralisé, œ est un réel quelconque : 


a(a—1)...(a—k+1) x 
k! 


+ 
i 
Me 
Sè 
8 
Col 


(+r)  =1+ax+... 


k=0 k=0 
DEE k—1 < 
(x) °=1+ar+...- OAE PACE ) ge += XO Oa (—-1)frf 
k! 
k=0 
[ee] OO —a 
Se a 
k=0 k=0 
12.9. Loi de Poisson. Durée de vie d’un système simple (fiabilité) 
1. — Chaque jour un cycliste parcourt la même distance. L'expérience lui a appris qu’il survient 


une crevaison de sa bicyclette en moyenne deux fois par mois. 


a — Calculer la probabilité qu’il survienne exactement une crevaison en une semaine (1 mois — 
4 semaines). 


b — Calculer la probabilité qu’il survienne exactement une crevaison en un mois. 

c — Calculer la probabilité qu’il ne survienne aucune crevaison en un mois. 

d — Calculer la probabilité qu’il survienne trois crevaisons ou plus en un mois. 

e — Calculer la probabilité qu’il survienne exactement quatre crevaisons en deux mois. 


2. — On se propose d'écrire explicitement la loi de Poisson en fonction du temps t et l’on désigne 
par À le nombre moyen d'événements par unité de temps. Donner l'expression de la loi de Poisson 
P(t) donnant la probabilité pour que k événements surviennent durant le temps t. 

On désigne par t, la suite discrète de la date des événements qui arrivent séquentiellement au 
cours du temps. La suite t, s'appelle flux d'événements, et on rappelle que les temps d’apparition 
des événements sont indépendants les uns des autres. 

On désire étudier la statistique de la variable aléatoire € = t;:1 — ti qui est le temps qui 
s'écoule entre deux événements consécutifs. Après avoir remarqué que £ est une variable aléatoire 
continue, calculer la probabilité F(t) = P(E < t) que la variable aléatoire £ soit plus petite que t. 
Pour cela on calculera d’abord la probabilité pour que, dans un intervalle t débutant à l'instant 
ti, il n’y ait aucun événement. En déduire la densité de probabilité f(t) à laquelle obéit la 
variable aléatoire £. Calculer la moyenne a de £ ainsi que sa variance o?. 

3. — Une propriété remarquable de cette loi. 

Si l'intervalle de temps £ est déjà entamé depuis un certain temps 7, on se propose de 
démontrer que cela n’a aucune influence sur la partie restante de l'intervalle, et que sa répartition 
sera la même que celle qui gouverne £, c’est-à-dire F(t). 

Pour démontrer cette assertion, on écrit que l'événement 7 a eu lieu et l’on étudie la loi de 
répartition conditionnelle de la partie restante n = £ — 7, soit : 


ft) = PE -T<tÉ>T). 
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On désigne par À l'événement € > T, B l'événement E€ — Tr < t. 
À l’aide du théorème des probabilités composées, donner l'expression de P(A- B); en déduire 
l'expression de @(t) en fonction de P, A et B. Montrer que l'événement A- B peut aussi s’écrire : 


T<É<t+7T, 


expression dont on calculera la répartition en fonction de F, t et r. 
Donner à présent l'expression de @(t) en fonction de F, t et 7. 
Remplacer F par l'expression calculée au § b et montrer que F(t) = d(t). 


12.10. Durée de vie d’un système. Loi de Weibull (1887-1979). Fiabilité 
La durée de vie d’un système physique est mesurée par la variable aléatoire €. On se propose 
d'étudier la répartition F(t) de cette variable, soit : F(t) = P(E < t). 

On désigne par A(t) le coefficient des défaillances en fonction du temps t que l’on définit de 
la façon suivante : 


n(t)— n(t + At) 
E Atn(t) : 


n{t) étant le nombre de systèmes ayant vécu jusqu’à l'instant t, At étant un intervalle de temps 
petit (infiniment petit du premier ordre). 


a — Montrer que F(t) peut se mettre sous la forme : 


F(t)=1-—— où n=n(0). 


b — Donner l'équation différentielle du premier ordre à laquelle obéit la répartition F(t) en 
fonction de A(t). On exploitera le fait que l’on peut écrire : 


— n(0) + n(0) — n(t + At) 
Atn(t) / 


puis que At est un infiniment petit du premier ordre. 


16 =" 


c — En intégrant l'équation différentielle obtenue, donner l’expression de F(t) en fonction de 
A). 
d — Une classe intéressante de coefficients de défaillance A(t) est donnée par l'expression : 
A(t) = oat! avec X > 0 et a>0, 
donner alors l'expression de F(t) ainsi que celle de f(t). 
2 


e — Calculer la moyenne à de £ ainsi que sa variance g*. 


f — Cette loi est connue sous le nom de loi de Weibull et trouve son emploi en théorie de la 
fiabilité. La densité de probabilité f(t) (ou la répartition) établie à la question b du précédent 
problème est un cas particulier de la loi de Weibull, donner alors la valeur de a qui correspond 
à ce cas particulier. 

N.B. - On donne : 


T(x + = fus exp(—u) du. 
0 
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12.11. L'inégalité de Kolmogorov (1903-1987) 


Soit X une variable aléatoire continue de moyenne nulle E(X) = 0, d'écart quadratique a? et 
de fonction de distribution f(x). On considère un nombre arbitraire t positif. 


a — Rappeler la démonstration de l’inégalité de Bienaymé-Tchebycheff : 
1 
P(IX| > to) < 5 


où P désigne la probabilité, et l’on précisera le domaine de validité de t. 


b — À présent, on suppose que |X| a une borne supérieure désignée par B. Montrer que : 


E(X?) < J a? f(x) dz + I r? f(x) dz, 
{xl <a Ixl>a 
expression dans laquelle a est compris entre 0 et B. En déduire que 
E(X?) — a? 
P(|X| > a) > pr 
Cette expression s’appelle inégalité de Kolmogorov. 


12.12. Loi quasi normale 


a — On considère une variable aléatoire Y de moyenne nulle E(Y) = 0, d'écart quadratique 
moyen E(Y?) = ø? et obéissant à une distribution gaussienne. Rappeler, au besoin en les 
démontrant, les expressions des moments centrés d’ordre trois et quatre. 


b — Par définition, nous dirons qu’une variable aléatoire X obéit à une distribution quasi 
normale lorsque : 


E(X’) #0 et E(X’) = 3]E(X?)}. 


On se propose de calculer les paramètres a et b de la loi : 


1 5 A ( =) 
x) = ——(ax" + br — 3a) exp | —-— 
f(z) NA Yexp{-T }, 
de telle façon que f(x) soit une loi quasi normale. On montrera que f(x) est bien une densité 
de probabilité, puis on calculera E(X), E(X?), E(X?) et E(X!). Enfin, on déterminera a et b. 
Une fois les conditions établies, donner l'écart quadratique moyen g? de la loi normale dont 
les moments deux et quatre coïncident avec ceux de la loi quasi normale envisagée. 


13. La fonction caractéristique 


13.1. (5x)" tend vers une gaussienne quand n croît positivement 


a — Soient deux variables aléatoires indépendantes £; et 2, qui sont toutes les deux normales 
(gaussiennes) centrées et réduites. Calculer la fonction caractéristique de chacune d’elle, puis la 
fonction caractéristique de la variable 7 = £1 + £2. En déduire la fonction de distribution de 7. 
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b — Les variables indépendantes sont toujours gaussiennes mais ne sont plus centrées réduites. 
On désigne par mı et m2 les moyennes respectives et par g; et o2 les écarts quadratiques moyens. 
Donner la fonction de distribution de 7 = £1 + £2. 


c — Généraliser le calcul du § b en considérant la variable 


Hd 
k= 


puis en déduire le théorème d’addition des moyennes et le théorème d’addition des variances 
(écart type élevé au carré). 


d — On considère une variable aléatoire £ à distribution rectangulaire, c’est-à-dire uniformément 
répartie sur l'intervalle (—0,5 ; 0,5). Donner la fonction caractéristique ®(t) de cette variable 
aléatoire, puis la fonction caractéristique de la variable aléatoire £/n, et enfin la fonction 
caractéristique Ÿ(t) de la variable aléatoire : 


où les £x sont des variables aléatoires indépendantes à distribution rectangulaire uniformément 
réparties sur l'intervalle (—0,5 ; 0,5). 

Au moyen d’un développement limité au deuxième ordre de log, Y(t), montrer que la fonction 
caractéristique tend vers une gaussienne quand n tend vers l'infini. En déduire la loi de 
distribution de u quand n devient grand devant l'unité. 

Déduire de cet exercice le comportement asymptotique de la fonction : 


ra= (25) 


Effectuer deux programmes qui permettent la vérification expérimentale de conclusion obte- 
nue. L'un effectuera les auto-convolutions successives de la fonction de distribution, l’autre le 
calcul direct de la fonction caractéristique. 

À partir de quelle valeur no de n peut-on admettre l’approximation asymptotique ? 


14. La loi du x? et la loi de Student 


14.1. Le test de Pearson 


On désire montrer que le paramètre de Pearson 


2 7 (Y - npa)? 
rs = 
q=1 Pa 
obéit à une loi du x? à (r — 1) degrés de liberté. 

On considère une variable aléatoire X dont on se donne un échantillon constitué de n éléments 
notés Xı, X2, CPE Xn. 


On réalise une partition de laxe réel en r intervalles notés L1,12,...,1; et l'on désigne 
par P1,P2,...,D- les probabilités théoriques que X appartienne respectivement aux intervalles 
L,1,...,1,. (Réalisation d’un histogramme.) 


481 


MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ 


Soit æ1,72,...,%n une réalisation de l'échantillon. On note par y, le nombre de valeurs 
T1,T22,...,%n Qui appartiennent à l'intervalle Iq avec q —1,2,...,r. 

Yq est la valeur d’une variable aléatoire Y} obtenue pour ladite réalisation. (Ici, les majuscules 
Xk, Yk,- .. sont des variables aléatoires tandis que les minuscules £k, Yk, ... sont les réalisations 
de ces variables aléatoires.) 

Pour parvenir à nos fins, nous montrerons que x? est la somme de carrés de variables 
gaussiennes centrés, réduites (au sens large) et indépendantes obéissant cependant à une relation 
linéaire. 


a — On rappelle que la fonction caractéristique d’une variable aléatoire à n dimensions (ou 
vecteur aléatoire) X = (X1,X2,...,X,) est l'espérance mathématique de la variable complexe 


exp{j(t1 Xi + t2 X2 ++ tX) 
soit : 
P(tusta,... tn) = M {expl} (t1 Xı + t2X2 ++: +tnXn)]} 


où M { } est l'opérateur espérance mathématique portant sur chacune des variables. 
Montrer que le moment du premier ordre de la variable X est donné par : 


1 of 
Mig = +" pour t =t2. =tn=0 
lq j ôt P 1 2. n 
et celui du deuxième ordre par : 
1 æf 
Mag = 7 - A pour ti = t2.. = tn = 0. 
b — On désigne par px la probabilité théorique que la variable X; appartienne à l'intervalle Ty. 
Montrer que les variables Y1, Y2,..., Y, obéissent à une loi de probabilité multinomiale : 
PM = m, Yz = Y, = n) 4 Pipe... per 
1 = N1, Y2 = N2,... Yr = Nr) = minal.. n!” Po ..-Pr >» 


c — Nous allons obtenir, par voie directe, la fonction caractéristique de cette loi multinomiale. 
Pour cela, on considère une suite de vecteurs aléatoires indépendants et de même distribution 
notée (Z, Z3, ..., Z2) avec q = 1,2,...,n. 

Ces composantes prennent la valeur 0 ou 1, et Pon pose : 


P(Z} =1)=p; et P(Z} =0)=1-—p;. 
Montrer que (Y1,Y2,...,Ÿ;) = Dali Z3, ..., Z4), puis donner expression de la fonction 
caractéristique : @q(ti,t2,...,tn) de (Z, Zł2,..., Z4). En déduire, au moyen du théorème 


concernant la fonction caractéristique d’une somme de variables indépendantes, la fonction 
caractéristique : 


Qaltı, t2,- . satn) de (Yi, Y2, s ., Yr). 


d — En utilisant les relations établies au § a, calculer le moment du premier ordre mia et le 
moment du deuxième ordre m2, des composantes Y} du vecteur aléatoire (Y1,Y2,...,Y.). 
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e — On désire étudier le comportement asymptotique de la loi multinomiale quand n tend vers 
l'infini. Pour cela, il faudra transformer les composantes Y} en composantes centrées réduites. 
Montrer que le changement de variables : 


Ya — Pa 


U. == 
q NP 


répond à la question car la nouvelle variable U, ne dépend pas de n. Montrer que la fonction 
caractéristique du vecteur U = (U1,U2,...,U,) tend vers la fonction 


2 
1 T à Y 
exp 4 =z | 2T Eeva 
q=1 qg=1 


qui est la fonction caractéristique d’une loi normale (dégénérée). Pour y parvenir, on effectuera 
des développements limités à l’ordre deux... 


Montrer que De U,/Pa = 0. 


f — Déduire des résultats précédents, que la variable aléatoire 


Y, — npa” 
2-54 q 
q=1 Pa 


obéit à une loi du x? à (r — 1) degrés de liberté. 


Remarque : On rappelle un résultat élémentaire d’analyse : lim (1 — s)" tend vers exp(—s) 
quand n tend vers linfini. 


14.2. Le test de Student 


On considère une population parente gaussienne dont la moyenne théorique est m et l'écart type 
théorique ø. On extrait de cette population un échantillon de n individus. On désigne par x la 
variable caractérisant la mesure sur la population et par x; la variable associée au 4° individu. 

On se propose d'étudier l'écart entre la moyenne de l'échantillon (x) = +Ð; x; et la 
moyenne théorique m, c’est-à-dire la probabilité P(|{x) — m| > I), I étant un intervalle qu’on 
se fixe à l'avance — ou encore on peut se fixer la probabilité P et l’on détermine l'intervalle de 
confiance T. 

Pour se fixer les idées, il s’agit d’un échantillon de 20 individus dont on a mesuré la taille x. 
On a trouvé expérimentalement : x = 170,86 cm et o = 3,65 cm. 

On souhaite que |(x) — m| appartienne à un intervalle de confiance où il y ait 90 chances sur 
100 de trouver la valeur de (x) donnée par l'échantillon. 


1" approche — Calculer I en utilisant l'inégalité de Bienaymé-Tchebycheff. Réaliser l’applica- 
tion numérique. 


2° approche — On suppose que, comme c’est le cas dans cet exemple, le nombre d'individus 
n’est pas très grand, et l’on se propose d'étudier la répartition de la variable aléatoire : 


„Vila -m) | 
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a — Montrer que 


b — Sur les variables centrées (x; — m), on effectue un changement de coordonnées orthogonales 
au moyen de la matrice orthogonale A d'éléments (a;;) 


Montrer que 


n n 
2 2 
25) m-n) 
j=1 j=1 
1 
Ern £ 
c — Montrer que (z) - m = “% 
d — Montrer que 
gao Titrat teaa 
E n—1l 


e — Montrer que les variables z4 sont centrées, normales, indépendantes et de même variance. 


f — Montrer alors que t est une variable de Student dont on précisera le nombre de degrés de 
liberté. 


g — On désigne par P(|t| > to) = 1—a la probabilité que |t| dépasse une certaine valeur positive 
to. Déduire la relation entre |{x) — m|, o, to et n. 


h — Effectuer l'application numérique. On donne : 
to,o5(19) = 1,729 to,o5 (20) = 1,725 to,o5(21) = 1,721. 


3° approche — On suppose que la variable t définie au § 14.2 est gaussienne. Effectuer 
l'application numérique dans ces nouvelles conditions. On donne : 


1,645 

ee fe (5) « 1 — 0,05 
X — — rem, ass , . 

V27 J j 2 


Commenter les trois résultats obtenus, et en déduire la valeur de la répartition de Student 
to,o5 (00). 
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15. Systèmes à plusieurs variables aléatoires 


Système linéaire surdéterminé. Matrice de corrélation 


Dans un document à caractère historique de 1321 on trouve le tableau H.2 d'imposition. 


Tableau H.2. 
N° Nombre Quantité Impôt 
de la famille de personnes détenue 
1 3 4,5 1,5 
2 4 3.8 2 
3 3 3,1 2,1 
4 5 0 1,1 
5 7 7,7 4 
6 3 4,1 2 
7 4 3,2 2 
8 2 5,0 3,6 
. 9 6 1,5 1,6 
10 3 6,0 2,5 


On désigne par x la variable aléatoire associée au nombre de personnes, par y la variable 
aléatoire associée à la quantité détenue et enfin z la variable aléatoire associée à l'impôt perçu. 
Ensuite, on désigne par n le nombre de familles. Par ailleurs on notera (q) la moyenne de la 
variable aléatoire q et par o? sa variance. 


1. — Dans l’hypothèse raisonnable de dépendances linéaires, calculer les coefficients de corréla- 
tion suivants : 


a — r, entre le nombre de personnes et l’impôt payé, 
b — r;, entre le nombre de personnes et la quantité détenue, 
C — Tyz entre la quantité détenue et l’impôt payé. 


2. — Quelles sont les liaisons de corrélation qui sont fondées ou significatives? On donne un 
extrait de la table de Student : 


to,05(8) = 1,860 to,05(9) = 1,833 to,o5(10) = 1,812. 


16. Critères de conformité 


16.1. Exercices du cours 


a — Faire un programme qui réalise un histogramme. Les données faisant l’objet du classement 
seront fournies par le générateur de nombres pseudo-aléatoires de Lehmer. 


b — Vérifier que les nombres générés obéissent bien à une loi de distribution uniforme. 
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c — Soit {£;} une suite de nombres pseudo-aléatoires fournie par le générateur de Lehmer. 
Montrer que la suite de nombres pseudo-aléatoires : 


12 
Nk = De -6 


o + To 


i=1 


obéit à une distribution gaussienne de moyenne xo et d'écart type o. 


d — Cette façon d'obtenir des nombres aléatoires à distribution gaussienne présente un défaut : 
les queues de distribution ne sont pas bonnes. On propose d'étudier un autre générateur de 
nombres gaussiens qui respecte les queues de distribution : 


m = [-210g,(6)]//? cos(2ré;41) 
Nk+1 = [--2 108. (6)? sin(2Té;1). 


Vérifier que ce générateur fournit des nombres aléatoires à distribution gaussienne. 


16.2. Étalonnage d’un appareil de mesure 


L’étalonnage d’un appareil de mesure a porté sur 400 mesures dont nous nous proposons 
d'étudier les incertitudes; celles-ci, évaluées en mètres, sont regroupées dans le tableau H.3, 
où m; est le nombre de mesures tombant dans un intervalle donné d’après H. Ventsel. 


Tableau H.3. 


e; (m) 20 30 40 50 60 70 80 90 100 
Mi 21 72 66 38 5l 56 64 32 


On cherche à représenter cette distribution expérimentale par une distribution rectangulaire : 


p(z)=1/(b—a) pour a<z<b 
p(æ) = 0 ailleurs. 


a — Pour déterminer a et b, on se propose de calculer la moyenne m et l’écart quadratique moyen 
o?, ce qui fournira un système de deux équations à deux inconnues. Donner les expressions de 


m et o? en fonction de a et b. Vérifier que a et b jouent un rôle symétrique. 


b — Calculer a et b en fonction de m et o?, puis numériquement m,o?, a et b. Calculer la 
probabilité théorique de tomber dans chacun des intervalles de classement figurant dans le 
tableau. | 


c — Calculer le x?. Quel est le nombre de degrés de liberté? Quelle est approximativement 
la probabilité de dépasser la valeur du x?. Peut-on retenir l’hypothèse d’une distribution 
rectangulaire ? 


16.3. Tests d'hypothèse 


Étude de la distribution d’une hauteur d’arbres. On a effectué l’étude d'une population parente 
d’une espèce déterminée d'arbres, et en particulier, on s’est intéressé à leur taille. On a trouvé 
les résultats présentés dans le tableau H.4, page ci-contre, d’après P. Dagnelie. 


486 


ANNEXE H. PROBLÈMES ET EXERCICES 


Tableau H.4. 


h (m) 18 20 22 24 26 8 30 32 34 36 
fréquence 2 3 9 12 27 16 7 2 2 


a — Calculer les deux premiers moments m et D puis l'écart type o. 
b — Doit-on regrouper un certain nombre d’intervalles? Le cas échéant, proposer une solution. 


c — L'hypothèse H est la loi normale. Calculer les probabilités par intervalles de regroupement. 


d 


2 
Calculer le x£.. 
e — Peut-on raisonnablement conserver l'hypothèse H? Justifier votre réponse. 


f — Le test de Kolmogorov donne-t-il une confirmation du résultat obtenu au § e? On détaillera 
tous les calculs. 


17. Étude des dépendances dans le cas linéaire 


17.1. Test d'indépendance stochastique des résultats d'observations 


a — Générer 1 000 nombres pseudo-aléatoires à distribution gaussienne. On se propose de vérifier 
les tests usuels d'indépendance stochastique sur cet échantillon. 


b — Effectuer le test de la médiane. 
c — Effectuer le test des suites ascendante et descendante. 


d — Effectuer le test de la somme des carrés des différences successives. 


17.2. Homogénéité d’une suite de variance 


Dans le cadre du schéma de régression, on désire vérifier l’homogénéité d’une suite de variances. 
À cet effet, on fabrique deux séries de données sur lesquelles on se propose de retrouver les 
caractéristiques. Pour 5 valeurs de l’abscisse x, on détermine 5 valeurs de l’ordonnée y selon la 
loi y = ax + b. On affecte un indice aux points æ;, Yiọ avec i = 1,2,...,5. On choisira tous les 
paramètres comme on l'entend... 


a — Pour chaque yio on prend 10 valeurs obtenues à partir d’un générateur de nombres pseudo- 
aléatoires gaussiens d'écart type o ; on les note y;j, elles sont centrées sur yp et ont la variance 
o?. Il s’agit du même écart type pour les 50 nombres tirés. 


b — Pour chaque z; on choisit un écart type o différent tel que les g? obéissent à une loi crédible 
telle que : 


o? = obh? (x1). 


Effectuer le test de l’homogénéité des suites de variances sur les deux échantillons. Tenter de 
trouver une fonction qui soit différente de h?(x;) mais qui en soit une bonne approche. 
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17.3. Test d'indépendance stochastique du tirage d’un échantillon 


On considère le jeu de pile ou face durant lequel on note la succession des apparitions. On note 
À l'apparition de face et B l'apparition de pile, la probabilité de présenter l’une des deux faces 
est 0,5. 

On appelle chaîne de longueur n, la suite des À et B obtenue durant l’expérience, dans l’ordre 
de leur apparition, au moyen de n tirages consécutifs. On appelle sous-chaîne une suite constituée 
uniquement de À (ou de B) limitée à droite et à gauche par un B (resp. A). Nous nous proposons 
d'étudier quelques caractéristiques des chaînes et des sous-chaînes. 


Partie 1. a — Montrer que la probabilité m de tirer une sous-chaîne constituée de u éléments 
(sous-chaîne de longueur u contenant pA ou uB) est égale à (1/2}". On énoncera le théorème 
sur lequel se fonde le calcul. 


b — Calculer m la longueur moyenne et g l'écart type des sous-chaînes. 


c — On effectue le tirage de K sous-chaînes. Donner Àg la longueur moyenne des chaînes 
contenant K sous-chaînes. 


d — Donner la probabilité P d'obtenir au moins une sous-chaîne (parmi les K), dont la longueur 
vj soit supérieure ou égale à une valeur arbitraire positive Mo (on pourra éventuellement calculer 
la probabilité contraire). On énoncera le théorème sur lequel se fonde le calcul. 

Application numérique : K = 10, Mo = 8, calculer P. 


e — On souhaite que la probabilité P d’obtenir au moins une sous-chaîne de longueur supérieure 
ou égale à Mo soit inférieure ou égale à 0,05. Donner alors la relation entre M et K, puis donner 
une expression approchée de Mo en fonction de la longueur n de la chaîne (on prendra n = 2K). 


f — Ce résultat peut être utilisé comme test n° 1 servant à vérifier l’indépendance stochastique 
des résultats d'observation (test fondé sur la médiane de l’échantillon). Effectuer l'application 
numérique pour une chaîne de longueur n = 100, et comparer le résultat avec celui obtenu à 
partir de l’expression approchée donnée dans le cours. 


Partie 2 — On suppose que le nombre K de sous-chaînes est grand devant l’unité, vérifier 
qu’il en est de même de Ax. On se propose d'étudier la variable aléatoire € (désignée par n 
précédemment) qui est la longueur d’une chaîne constituée de K sous-chaînes de longueur l; : 


K 
t=) i 

j=l 

a — Calculer X l'écart type de la variable £. Rappeler le théorème central limite. En déduire la 
distribution de la variable aléatoire £, puis donner l'expression de la probabilité P(£ < 1) pour 
que £ soit plus petit que la valeur arbitraire vo. 


b — En choisissant le seuil de signification a = 0,05, donner l'inégalité à laquelle obéissent £ et 
K. 
On donne : 
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c — Si l’on se donne la taille £, de la chaîne, montrer que le nombre de sous-suites K (fonction 
de £) doit être plus grand qu’une certaine limite Kmin pour ne pas tomber dans la queue de 
distribution (1,96 ; oo), cas des événements peu probables. 


d — Montrer que ce résultat peut servir de test n°2 des séries fondé sur la médiane de 
l'échantillon. Effectuer le calcul numérique pour une chaîne de longueur £ = 100, et comparer 
ce résultat à celui obtenu avec l’expression approchée donnée dans le cours. 

Montrer que la limite du module de la différence de ces deux derniers tests (test n° 2 et test 
du cours correspondant) est 1/2 quand la longueur de la chaîne tend vers l'infini. 


e — Quelles critiques de principe peut-on former concernant l'application simultanée de ces 
deux tests numérotés 1 et 2? (Il s’agit du strict point de vue de la rigueur.) Montrer brièvement 
comment on pourrait pallier ces inconvénients. 


Quelques résultats utiles 


XO kat! = SV (+ 1e = en =Ņ krt + Ya" 
k=0 k=0 k=0 k=0 


œ 


T 
2a Z (1 — x)? 
Si Sokat +2 kat + Yat D rt! 
(1 Ja zx) k=0 k=0 k=0 k=0 


SE ii z(1 dE x) 
k=0 


Il 


(x) 
(1+a)*=1-+na si [al <1. 


17.4. Loi F(m, 1). Étude du rapport de deux variances : 
loi de Fisher (1872-1962) - Snedecor (1881-1974) 


On considère une population parente sur laquelle on prélève un échantillon de n individus. Ces 
n individus font chacun l’objet de la mesure de deux grandeurs physiques dont les résultats sont 
notés (zi, yi), i = 1,2,..., M. 

Les mesures des grandeurs x et y sont en réalité des variables aléatoires £ et 7 dont une étude 
préalable a montré qu’elles vérifiaient les critères d’applicabilité du schéma de régression si bien 
que l’on peut écrire : 


Y(x) = a + b(x — zo). 
On appelle variance empirique s? la moyenne empirique des carrés des résidus, soit : 
2 1 Š 2 
8 = [Y (z:) =T yi] ; 


m —14 
i=1l 


a, b et 3? caractérisent entièrement la régression étudiée. 
On considère un autre échantillon de taille n, différente ou non de m, qui fournit une autre 
droite de régression : 


Y'(æz) = a! +b (£ — x), 


489 


MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ 


` 2, . ._ o 2 
à laquelle est associée la variance empirique s^. 


Imaginons que les échantillons aient été prélevés à des époques différentes, mais que a et a” 
d’une part puis b et b’ d’autre part soient grosso modo les mêmes (ce qui nécessiterait une étude 
en soi). On désire savoir si au cours du temps on a bien affaire à la même population parente 
ou non. Autrement dit, est-ce que la différence entre les deux droites peut s'expliquer par les 
fluctuations aléatoires des échantillons ? 

L'étude du rapport des variances empiriques v? = s?/s' 2 qui obéit à une loi que nous noterons 
F(m,n) permet de répondre oui à la question dans le cas où : 


2 
Fi-a2(m—1,n —1) < i < Fam — 1,n —1) 
s 


a étant le seuil de signification usuel. On se propose d’établir la loi de distribution F(m,n) 
appelée loi de Fisher-Snedecor. 


1. — On désigne par €? la variable : 


1 m 
2 y 2 
ES ni $i 
i=1 


la somme des carrés de m variables gaussiennes indépendantes, de moyenne nulle et d'écart type 
o. En opérant d’une façon tout à fait semblable à la méthode utilisée pour établir la loi du x°, 
donner la loi de distribution de &2?. 


2. — On désigne par 7° la variable : 


1 n 
2 _ 2 
n Spi" 


la somme des carrés de n variables gaussiennes indépendantes, (indépendantes entre elles et 
également des €?) de moyenne nulle et d'écart type o. 


a — Écrire la loi de distribution de 7°. 


b — Rappeler la démonstration du théorème concernant la distribution du rapport de deux 
variables aléatoires indépendantes y = T/d,Tr et @ ayant respectivement pour fonctions de 
distribution p1(r) et pa(d). 


2 
c — Déduire la distribution du rapport des deux variables y = >- 


n2 
d — Calculer la moyenne de y notée (y). 


e — Calculer l'écart type de y noté (o°). 


f — Préciser les degrés de liberté l et k dans la loi F(l, k) en fonction de m et n. Justifier la 
réponse. 


g — Montrer que Fi-a(k, l) = FK 
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Quelques expressions utiles 


1 


m/2-1 TE .1\—m/2 
TT (m2) * exp(—x/2) > (1—2jt) ; 


18. Analyse de corrélation 


18.1. Le coefficient de corrélation. Schéma de corrélation 


Il nous faut ici encore fabriquer un lot de données que l’on se propose à la suite d'étudier. La 
variable x est aléatoire à distribution gaussienne d'écart type o. Dans un premier temps, on 
calcule une valeur z = ax + b après avoir tiré x = E. On choisira les paramètres comme on 
l'entend... À z on ajoute une variable gaussienne ô de moyenne nulle et d'écart type o’. Il faut 
veiller à ce que 6 et £ ne soient pas corrélées. Comment s’en assurer ou y parvenir? 

Remplir un premier fichier de 50 à 100 couples de données selon ce procédé en choisissant 
6 = o/10. 

Remplir un deuxième fichier de 50 à 100 couples de données en choisissant o’ = ø. 

Remplir un troisième fichier de 50 à 100 couples de données en choisissant o’ = 100. 

Calculer chacun des trois coefficients de corrélation r. Examiner éventuellement l'hypothèse 
r = 0. 

Calculer l'intervalle de confiance associé à chacun des coefficients de corrélation pour un seuil 
de signification donné a. 


18.2. La distribution gaussienne à deux dimensions. Coefficient de corrélation 


On considère une population parente sur laquelle on a prélevé un échantillon de taille n très 
grand devant 1. Chaque individu est caractérisé par deux grandeurs € et 7 qui sont des variables 
aléatoires. On désigne par Mme et My les moyennes, par o et o? les écarts quadratiques moyens 
respectivement de £ et 7. 


a — On appelle z et y les variables centrées réduites associées à x et y. Donner les expressions 


de x et y. 
Une analyse appropriée a montré que la fonction de distribution des variables x et y était de 


la forme : 


z? — 2axy + y? 
p | 


expression dans laquelle À, a et 8 sont des paramètres. 


(x, y) = Aexp ( 


b — (x, y) étant une densité de probabilité, exprimer A en fonction des autres paramètres a 
et 8. Pour effectuer le calcul, on écrira que z? — 2axy + y? = (x — ay}? + (1 — a?)y?, puis on 
effectuera un changement de variables : attention au jacobien... 
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c — Donner l'expression de la fonction de répartition des variables x et y notée Y(x, y). On sait 
que la répartition de la variable x est ®,(x) = Y(x,c). Calculer la fonction de distribution de 
la variable x. 


d — Quelle relation doivent satisfaire les coefficients a et 8 pour que ®,(x) soit la loi normale 
réduite. Montrer que, dans ces conditions, la fonction de distribution de la variable y notée 
®, (y) suit aussi une loi normale réduite. 


e — Calculer X,,, la covariance des variables x et y, en déduire le coefficient de corrélation Tey- 
Dans le cas où a = 0, donner l'expression de ®(x,y) en fonction de ®,(x) et P (y). Peut-on 
déduire que la non-corrélation entraîne l’indépendance des variables x et y? Argumenter. 


f — Dans le cas où a Æ 0, donner l'expression de la droite de régression de y en g. 


g — Calculer la fonction caractéristique de D(x, y). 


18.3. Analyse de régression. Distribution de Student 


Reprendre les fichiers fabriqués au cours des exercices 17.1 et 17.2. 
Calculer les coefficients de la droite de régression y = ax + b dans chacun des différents cas. 
Estimer la précision sur chacun des coefficients a pour un seuil de signification donné a. 
Donner l'intervalle de confiance concernant y pour une valeur donnée x de la variable x dans 
chacun des cas typiques. 


18.4. Étude d’un changement de phase 


L'étude d’un changement de phase permet d’effectuer la mesure d’une grandeur thermodyna- 
mique Ÿ en fonction de la température X. La représentation graphique donnée par la figure H.6 
montre que les points expérimentaux se disposent selon deux segments de droite désignés par 


Sı et S2. 


Y 
A 
Y, 
O X, X Figure H.6. Étude d’un changement de phase. 


Expérimentalement, on sait que l'incertitude sur chacune des mesures effectuées (Yp), qu'il 
s'agisse des points du segment Sı ou des points du segment S2, correspond au même écart type 
a. Les incertitudes constituent une variable aléatoire dont la moyenne est nulle. De plus, on 
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admettra qu’il n’y a aucune incertitude sur les valeurs (X) du paramètre X. Une extrémité 
de Sı et une extrémité de Sz correspondent à la même abscisse Xo qui est bien déterminée 
expérimentalement. On s'intéresse à la transition au point Xo, c’est-à-dire à la grandeur H = 
Y> — Yı où Y; et Yz sont représentés sur la figure. 


a — Sachant que le segment Sı est déterminé par N; mesures et le segment S2 par No mesures, 
indiquer de quelle manière on pourra estimer la grandeur H. On justifiera l’option retenue. 


b — Estimer l'incertitude sur la détermination de H, il s’agit bien sûr d’une détermination 
statistique. 


c — Réaliser l’organigramme des opérations conduisant au traitement correct des données 
expérimentales. 


18.5. Mesure d’une température par spectroscopie 


L'enregistrement d’une bande électronique émise par une molécule diatomique permet, dans la 
mesure où l'équilibre thermodynamique local est atteint, de déterminer la température de ladite 
molécule. 

Le principe est le suivant : la bande est constituée d’une suite de raies dont on peut mesurer 
pour chacune la surface, laquelle est proportionnelle à l'intensité relative Iy (éventuellement 
après avoir tenu compte de la correction due à la fonction d’appareil), et auxquelles on peut 
affecter un nombre entier J appelé nombre quantique de rotation. 

Sans entrer dans les détails, pour de nombreuses molécules diatomiques, la théorie permet 


d'établir la relation suivante : 
1 
oz. ( Dy )=4- BH 


2J +1 T 


où J est l’intensité relative de la raie J (donnée expérimentale), À est une constante calculée 
(donnée considérée comme rigoureuse), B est une constante calculée (donnée considérée comme 
rigoureuse), T est la température absolue que l’on cherche à évaluer. 


a — Sachant que l’on dispose de N données expérimentales Ty, comment déterminer T? 

b — Quelle est la précision statistique de cette détermination ? 

c — Réaliser l’organigramme des opérations décrivant le traitement automatique des données 
expérimentales. 

18.6. Solubilité du nitrate de sodium dans l’eau 


Voici le tableau H.5 de résultats, obtenus par Mendéléev (1834-1907), donnant la solubilité y 
dans l’eau du nitrate de sodium en fonction de la température T, soit y = f(T), les grandeurs 
y et T étant exprimées en unités arbitraires. 


Tableau H.5. 


y 66,7 71 76,3 80,6 85,7 92,9 99,4 113,6 125,1 
T 0 4 10 15 21 29 36 51 68 
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Peut-on approcher la loi de solubilité par une relation linéaire? On justifiera la réponse puis on 
calculera les coefficients de la droite de régression de y en T, coefficients obtenus par la méthode 
des moindres carrés. 

On désire connaître la solubilité pour la valeur T = 40 laquelle ne figure pas dans le tableau. 
Donner alors la valeur correspondante de la solubilité ainsi que l’intervalle de confiance de cette 
détermination pour un niveau de confiance de 0,9. 

On donne un extrait de la table de Student : 


to,05(7) = 1,895 to,05(9) = 1,833 to,1(7) = 1,415 to,1(9) = 1,388. 


19. Les fractions continues 


19.1. Calcul d’une fonction donnée sous forme d’une fraction continue 


On dit que la fonction y(x) est donnée sous forme d’une fraction continue lorsqu'elle s'écrit sous 
la forme : 


T — Q0 
y(x) = Ao + 
g£ — € 
A1 + F 
— a 
Az + 2 
L — a3 
E 7 Fu 
í An t 


On se propose de la calculer à l’ordre n. Pour y parvenir, on forme une suite d’approximations 
Pr PR P | : > à ` 
g D g g z qui sont respectivement à l’ordre 1, à l’ordre 2,... à l’ordre n. 


a — Au moyen d’un raisonnement par récurrence, démontrer les relations suivantes : 
Pm41(£) = AmPm(£) + (£ — am-1)Pm-1 (7) 
Qm+1(x) ou An Qt) + (x De Am—1)Qm-1(x) avec Po =1,P; = Ao, Qo = 0,Q: = 1. 


b — En supposant que f(x) est une fonction continue indéfiniment dérivable sur un intervalle 
contenant x et £o, on se propose d'étudier le développement de la fonction f(x) au voisinage de 
la valeur x de la variable x qui est de la forme suivante : 


g — Lo 


f(x) = Ao + 
T — To 
Aı + mr 
Ah T ` 
= 40 
+43 DETE 
Ap- 
+44 + À 


Donner les valeurs de Ao et de A; en fonction de f(x) et de ses dérivées. 


k+1 k—1 dAg D 
= + Donner 
Ak+1 Ak-1 + dzo 


la valeur de 43 en fonction des coefficients ck = 4f (zo) avec k = 0,1,2,... 


c — On montre que les Ap obéissent à la relation de récurrence 


d - Donner le développement de log, (1+ x) en fraction continue, puis calculer numériquement 
la valeur de log, (2). 
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e — Rappeler le développement de log, (1 + x) en série de MacLaurin, puis calculer numérique- 
ment la valeur de log, (2) en retenant les quatre premiers termes. 


f — Estimer l'erreur entachant les résultats obtenus aux § d et e. Expliquer pourquoi le 
développement en fractions continues présente un avantage sur le développement en série de 
MacLaurin. 


20. Éléments de traitement du signal 


20.1. Détermination d'une constante de temps 


On désire réaliser l’étude expérimentale de la décharge d’un condensateur C à travers une 
résistance R. Pour cela on mesure la tension V; aux bornes du condensateur à des temps t;. Les 
résultats obtenus sont présentés dans le tableau H.6. 


Tableau H.6. 


t (s) 0 1 2 3 4 5 6 7 8 9 10 
V (volt) 100 75 55 40 30 20 15 10 10 5 5 


On se propose d'étudier ces données selon deux approches différentes, mais avant de passer 
aux applications numériques, on établira des relations générales obtenues en considérant que : 


1. les données sont numérotées de 0 à N, 
2. les temps t; sont en progression arithmétique de raison At. 
Rappeler l'expression analytique de la tension V en fonction du temps t. 


Approche n° 1 — Montrer qu’au moyen d’une transformation convenable, on peut se ramener 
à un problème linéaire dont on déterminera les constantes au moyen de la méthode des moindres 
carrés. On désigne par a l'inverse de la constante de temps. Donner la valeur numérique de a 
ainsi que l'intervalle de confiance + da défini de telle sorte qu’il y ait 70 chances sur 100 que le 
résultat réel tombe à l’intérieur de cet intervalle. 


Approche n° 2 — On recherche V(t) sous la forme suivante : 
V(t) = A+ Bexp(b.-t), 


et l’on se propose d'obtenir A, B et b par la méthode des moindres carrés. Pour se faire, on 
pose : 


u = exp(b - At) 
et pi =exp(b- ti) = exp[b(to + iAt)]. 


Donner l'expression de V; en fonction de À et p;, puis celles de Vj41 , Vj+2.-.. en fonction de 
A, pj et u. 

Si l’on note AV; = V;}1 — V;, donner alors les expressions de AV;, AV;,, etc. 

Éliminer px entre deux AV; consécutifs et donner l’équation qui les lie. Combien obtiendra-t- 
on de ces équations ? On désignera par K ce nombre. Résoudre ce système de K équations à une 
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inconnue par la méthode des moindres carrés et en déduire la valeur de b. Donner l'expression 
de l'erreur quadratique correspondante E?. 

Il reste à déterminer À et B. Montrer comment les obtenir par la méthode des moindres 
carrés, donner leurs expressions ainsi que l'écart quadratique correspondant E2, 

Calculer numériquement les valeurs de À, B et b. 

Que concluez-vous quant à l’utilisation de ces deux méthodes? 

Puisque les valeurs de a et b sont différentes, donner l'intervalle de confiance minimum Aa 
permettant d’encadrer la valeur b. Donner alors la probabilité de tomber dans l'intervalle ainsi 
défini. 
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l | Corrigés des problèmes 
et exercices 


1. Généralités sur le calcul numérique 


1.1. Calcul du nombre d'or 


La suite U, est formée de termes strictement positifs pour n > 0. La suite k, est évidemment 
minorée par 0, il suffit de montrer qu’elle admet une limite supérieure, pour cela, il suffit de 
remarquer que Un = Un_1 + Un_2 et d’écrire la relation de définition de kp : 

Un Un-1 Un 


z Un-2 
kn = = + A ie 
Un 1 Un 1 Un 1 Un_1 


Le dernier terme est plus petit que 2 car la suite Un est strictement croissante et positive ; on 
en conclut que kn est compris entre 0 et 2 quel que soit n > 2 et que la suite kn admet donc 
une limite. 

Désignons par y cette limite, on écrit alors : Un+1 — Un — Un—1 = 0 et l’on divise chaque terme 
par Uh_1 qui est différent de zéro pour n > 2. On obtient donc : 


n Un n 
Uni 4 — 1] =0, soit encore : E à 


= ; 1=0. 
Un-1 Un-1 Un Uni Un-1 


Quand n tend vers l'infini la dernière équation devient : y? — y — 1 = 0, dont la racine positive 
est : 


ie a = 1,618 033 989... 


Sur le plan du calcul numérique de y au moyen de la suite de Fibonacci, on remarque que 
kn est le rapport de deux entiers U, et U,_1 lesquels admettent une représentation sans erreur 
(pourvu qu'ils possèdent moins de 16 chiffres significatifs en notation décimale si l’on envisage 
l’usage du langage C en double précision). La seule erreur sur kp est donc l'erreur liée à la 
division. Si l’on se ramène à l'erreur relative, il sera inutile de poursuivre les calculs après que 
deux valeurs consécutives de kn seront égales à la précision relative €, donnée par la machine 
(et le langage utilisé) ; cela se traduit par légalité : 


kn 7 An 
BR Le, 
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Cette condition donne l'erreur relative la plus petite sur le calcul de y, mais le procédé est 
coûteux en temps de calcul. Le calcul direct de y donné par la résolution de l’équation du 
deuxième degré fournit une erreur relative plus grande : il faut tenir compte de l’erreur sur la 
racine carrée puis de l'erreur sur la soustraction suivie de l’erreur sur la division... 


Remarque : Sur le plan de la programmation, il ne faut pas réserver un tableau pour la variable 
indicée kn, seules deux valeurs consécutives sont nécessaires et suffisantes, et l’on fera un décalage 
chaque fois que l’on calculera une nouvelle valeur. D'ailleurs, on ne connaît pas la taille de ce 
tableau. 


1.2. Les polynômes de Tchebycheff 


Posons y = arccos(x), puis écrivons la relation de définition pour Th_1(x) et Th+1(x) : 


Thn-1(x) = cos[(n — 1)y] = cos(ny) cos(y) + sin(ny) sin(y) 
Ta41(x) = cosf(n + 1)y] = cos(ny) cos(y) — sin(ny) sin(y) 


additionnons ces deux relations : 
Tir) + Tn-1(x) = 2 cos(ny) cos(y) 
enfin retournons aux anciennes variables en remarquant que x = cos(y), soit : 
Taux) = 22Tn(x) — Th- (£). 


C’est donc une relation de récurrence entre trois polynômes consécutifs. Pour l'utiliser, il suffit 
de connaître les deux premiers polynômes Ti(x) et Ti(x) à savoir : 


To(x) = cos(0) = 1, 
et Ti(x) = cosfarccos(x)] = x. 


Ici encore, il ne faut pas utiliser de tableaux sauf si l’on désire effectuer une représentation 
graphique de ces polynômes. 

Il existe une source de difficultés qui va affecter la précision : le second membre de la relation de 
récurrence est une différence, il s'ensuit que, si les deux termes sont sensiblement les mêmes, une 
erreur importante pourra surgir et qui se propagera au cours des calculs. Il est donc intéressant 
de comparer les résultats obtenus avec l’utilisation directe de la fonction arccos(x) en cherchant 
à mettre en défaut l’algorithme. Il s’agit de faire ses gammes... 


1.3. Calcul des fréquences de la gamme naturelle et de la gamme tempérée 


Une des façons de fonder la gamme naturelle consiste à calculer les fréquences au moyen des 
quintes qui se situent sept demi-tons majeurs au-dessus de la note précédente : le rapport des 
fréquences est trois sur deux. Ce processus permet de déterminer les dièses. Pour ce qui concerne 
les bémols, ils sont déterminés par les quintes qui se situent sept demi-tons majeurs au-dessous 
de la note précédente, les fréquences sont dans le rapport deux sur trois. Une manière simple 
d'opérer consiste à écrire les douze demi-tons de la gamme puis à les calculer successivement. 
Si la fréquence d’une note sort de la gamme à déterminer, on la divise par deux s’il s’agit des 
dièses ou on la multiplie par deux s’il s’agit des bémols. Commençons à partir du laz (440 Hz) 
par définir les dièses. 
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La quinte du la est la note mi dont la fréquence est 440 x 3/2 = 660 Hz. On note que 660 Hz 
se situe bien dans l'intervalle (440 Hz, 880 Hz). Calculons à présent la fréquence de la quinte 
de la note mi, il s’agit de la note si : 660 x 3/2 = 990 Hz, cette fréquence n’appartient pas au 
bon intervalle puisqu'elle est supérieure à 880 Hz, c’est l’octave de la note dont on cherche la 
fréquence. Il suffit de diviser par deux la valeur de la fréquence pour se ramener dans le bon 
intervalle, soit 495 Hz. En poursuivant ainsi, on trouve les notes et les fréquences présentées 
dans le tableau I.1. 


Tableau I.1. 
la 440 Hz réf 626,48 Hz 
mi 660 Hz la# 469,86 Hz 
si 495 Hz fa 704,79 Hz 
fa# 742,5 Hz do 528,59 Hz 
do# 556,88 Hz sol 792,89 Hz 
sol# 835,31 Hz ré 594,67 Hz 


En poursuivant ainsi, on calculerait les doubles dièses. Maintenant, calculons les notes qui 
vont éventuellement être affectées d’un bémol (cf. Tab. 1.2). 


Tableau I.2. 
la 440 Hz mip 618,05 Hz 
ré 586,66 Hz las 412,03 Hz 
sol 782,22 Hz réb 549,38 Hz 
do 521,48 Hz sol 732,51 Hz 
Ja 695,31 Hz si 488,34 Hz 
sip 463,54 Hz mi 651,12 Hz 


En continuant de la sorte, on peut définir les doubles bémols. Quoi qu’il en soit on voit 
aisément que les différentes tonalités ne possèdent pas les mêmes notes, ou plus exactement, 
les mêmes notes ne possèdent pas les mêmes fréquences. Autrement dit, une fois l'instrument 
accordé dans une tonalité, il n’est pas possible d’en sortir (modulation) sans avoir le sentiment 
que l’instrument joue faux. La gamme naturelle propose un do# à 557 Hz et un ré, à 549 Hz. 
La gamme tempérée, due à J.S. Bach (1685-1750), propose d'accorder la même fréquence à ces 
deux notes. Autrement dit, l'intervalle d’octave sera divisé en douze demi-tons d’égale valeur 
dans une échelle logarithmique. 

Donc le rapport du logarithme des fréquences de deux notes consécutives, séparées alors par 
un demi-ton, est une constante quelle que soit la fréquence initiale de la gamme retenue, elle vaut 
(1/12) log, (2) = 0,057 762. On établit très facilement la table de la gamme tempérée (cf. Tab. 1.3, 
page suivante). 

On note que le do# et ré, ont la même fréquence de 554 Hz qui est intermédiaire entre les 
deux précédentes valeurs. Pour terminer, disons qu’il existe bien d’autres gammes et de façons 
de les concevoir et que l’accord d’un piano se rapproche de la gamme tempérée mais en diffère 
par de petites nuances qui donnent du relief, du volume, de la profondeur à l’instrument. 
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Tableau I.3. 

la 440,00 Hz mi 659,25 Hz 
la# ou sip 466,16 Hz mi ou fa 698,46 Hz 
si ou dop 493,88 Hz fa# ou sol, 739,99 Hz 
si# ou do 523,25 Hz sol 783,99 Hz 
do: ou rép 554,37 Hz sol# ou lap 830,61 Hz 
ré 587,33 Hz la 880,00 Hz 
réf ou mip 622,25 Hz 


1.4. Calcul de la constante d'Euler (1707-1783) 


Avec une machine qui effectue les calculs avec une précision relative de 107%, on obtient la 
précision optimale lorsque deux valeurs consécutives de la suite des y, seront égales à la précision 


de la représentation, soit : 
p 1 lo k+1 / 
A k Eg 1 Be k Yk 


En admettant que yp soit minoré par 1/2, on obtient l'équation transcendante qui donne k en 


fonction de q c’est-à-dire : 
1 k+1 
—— — —— | a 2.107. 
O ee 


Yk+1 7 Yk 
Yk 


& 1071. 


Sachant que k est très grand devant l’unité, on peut se livrer aux approximations commodes : 
k +1 1 1 
loge (=) = loge (: + z) x P 


E à 1 


il s'ensuit : 


IAE =q 
HI El paa 

de là on tire une valeur approchée de k œ% ,/1/2 1092, En utilisant une représentation de 
16 chiffres significatifs, il faut calculer environ dix millions de termes ce qui est évidemment 
prohibitif s’il existe d’autres méthodes. Estimons néanmoins l'erreur risquant d’affecter le 
résultat, dans le cas le plus pessimiste évidemment. Écrivons la relation de récurrence entre 
deux valeurs consécutives de 7x : 


1 l k+1 
NH UT ET o8. ( k ) 
il faut réaliser à peu près 2k additions (soustractions) qui introduisent une erreur absolue de 
l’ordre de 2-107% dans le pire des cas. On ne pourra donc compter que sur 7 chiffres significatifs 
après tant de calculs... 
Il n’y a pas de difficulté majeure à programmer la relation faisant intervenir les nombres 
de Bernoulli, il s’agit d’un développement asymptotique qui est divergent mais qui donne 
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d'excellents résultats si l’on tronque habilement la série. Lorsque l’on néglige les termes après 
le rang y, on commet sur y une erreur strictement mathématique inférieure à 2B, /(2um?”). 
Fixons m à la valeur 100 par exemple et regardons quelle doit être la valeur de u pour obtenir 
la meilleure précision mathématique. Raisonnons encore sur les erreurs absolues nous pouvons 
écrire : 


B 
2.1071 = 2—1. 
2410024 
Il n’y a pas d’autre solution que d’effectuer une tabulation pour u = 1,2,3,... Réalisons cette 
opération pour p = 4 et 5, on obtient respectivement pour le membre de droite : 
1 5 
——— a107! t —— g 1072. 
120 1008 6601001 


En conclusion, en choisissant m = 4, l'erreur de troncature strictement mathématique est 
inférieure à la précision usuelle de 10716. Il convient d'évaluer les erreurs liées à l'exécution des 
calculs, elles seront majorées par 4m10716 avec m = 100, autrement dit on aura mieux que 
13 chiffres significatifs. 

1.5. Calcul numérique des dérivées d'un polynôme à coefficients réels pour la valeur x = r 


a — Le schéma de Horner (1786-1837) est un algorithme qui permet de calculer la valeur d’un 
polynôme au moyen d’un nombre minimum d'opérations en utilisant un système de parenthèses : 


P,(x) = Sax = (a [{ilaoz + a1)x + axe + as}e + asla Jees bæ + an. 
k=0 


Pour x = r, on calcule donc la suite : 


vo — A0 
vı = Vor + @ı 
U2 = vır + a2 


On écrit P(x) = Ro car Po(x) est une simple constante. 


c — Le polynôme prend la forme : 


Paz) = (x — r)” Ro + (z — r)" Rte + (£ — r) PR, ++ (x —r)Rn_1 + Ra. 
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d — On écrit le développement en série de Taylor : 


P,(x) = rerh- D EX TN pagr), 


q=0 


expression dans laquelle on a remplacé h par (x — r). Par identification avec l'expression du § c, 
on obtient : 


1 d? 


ni 


1E ro] pour æ =r. 


e — Pour calculer effectivement les Ry, il suffit d'appliquer le schéma de Horner aux coefficients 
de P,(x) puis à ceux de Pa—ı(x) et ainsi de suite jusqu’à celui de P6(x) = Ro. Désignons par 
b; les coefficients de P,_1(x) ; on les calcule en fonction des ag de la façon suivante : 


n—1 
Paala) = S bjx! 
j=0 
bo = a0 
bi = Qı + bor 
bk = ak + bg_1T 
Rn = ün + bn-1f, 


on poursuit les mêmes calculs pour le polynôme P,-2(x) en notant toutefois que l’on perd une 
rangée. Ensuite on opère de la même manière pour Pa-3(®) et ainsi de suite jusqu’à l'obtention 


de Ro. 


1.6. Calcul Ms de la fonction ¢ de Riemann 


a — Ona:1— SE = dg et deux cas se présentent selon que s = 1 ou s #1: 


si s = 1 on obtient Z =/{log.(x)]l? qui diverge, 
1 

s—1 xl 

1 

s=1. 


et si s £ 1 on obtient I = |- 


J®, cette expression est finie 


si s > 1 et alors ona: I= 


. O0 OO 2 : tan A E 
b — L'erreur ep est comprise entre [y L dr et fy yi 4 dr, on en déduit alors les inégalités 
suivantes : 


ste l E OOE | L 
k+1 k 
ce qui s'écrit encore 
1 1 1 1 
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2 
Prenons un exemple : ¢(2) = TE 1,644 934), on calcule alors S100(2) = 1,634 983 903 puis on 


déduit que : 


1 1 
1 —— 2 1,6349 — 
1634983 + 757 <Ç(2) < 1,634983 + 755 
soit encore : 1,64488 <Ç(2) < 1,64498. 


I existe deux programmes dzeta0.c et dzetal.c qui réalisent ces algorithmes. 


1.7. Recherche d'une tangente commune à deux courbes 


a — On a ys = f(x) et f(x) — yo — (xs — xo)f'(xs) = 0 pour la première courbe et pour la 
seconde : yg = g(x4) et g(xg) — Yo — (£g — to)g'(xg) = 0. 

En général il faut rechercher la racine d'équations transcendantes (voire implicites) qui 
donnent xs et x, puis on calcule y; et yg. Pour cela, on utilise une des méthodes itératives 
proposées dans le cours. 


b ~ Passant par le point À, il existe en général deux tangentes à la courbe C; et à la courbe 
C2. Il faut donc choisir la tangente la plus petite en module. 


c — On désigne par À; un point de la droite £x = zo dont l’ordonnée est supérieure au plus 
grand des deux extremums de Ci et Ch, et par A> un point de la droite x = £o dont l’ordonnée 
est inférieure au plus petit des deux extremums de C1 et C2. 
Yf — Yo Yg- Vo 
Tf — To Lg — To 
menées de À aux deux courbes. Quand A parcourt le segment A1 Ao la fonction ® ne s’annule 
qu’une seule fois, et c’est pour cette valeur précisément que l’on obtient la tangente commune 
aux deux courbes. La dichotomie, par exemple, peut nous permettre d’obtenir cette valeur de 
yo. On examine le signe de cette fonction en A puis en (A1 + A2)/2 et ainsi de suite. Si la 
longueur A142 est de l’ordre de quelques unités, alors en une cinquantaine de tours d’itération 
nous aurons obtenu la valeur de yọ par où passe la tangente commune avec une précision de 
l’ordre de 1075, 

À condition que les fonctions f(x) et g(x) soit calculables de façon semblable, pour avoir des 
erreurs semblables sur les calculs de x} et £g, et une bonne précision sur la fonction ®, il faut 
choisir x approximativement au milieu de l'intervalle (£f, £g). 


On considère la fonction ® = qui est la différence des pentes des tangentes 


d — Dans le cas de fonctions implicites, on a (x, yf) = 0. La tangente à C1 s'écrit : 


dð ð 08 dy. 


= + . =0 
dr ðr Üy dx 
wa -W z 
d’où : Gr & PONT; et y = y. 
y 
On écri . Yf— Yy , — — A 
n écrit encore: =——"— = HA pour x = x et y = ys. Donc, pour connaître les valeurs x; 
Tf — To 


et yr, il faut résoudre le système non linéaire de deux équations à deux inconnues par une des 
méthodes itératives proposées dans le cours. On opère de la même façon pour l’autre tangente 
pour laquelle on écrit : 


Y (Ty, Yg) =0, 
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et : 
Yg — Yo oZ F 


— OUT TZ =X et Y = Yo. 
Tg — To Y; P 9 Y =Y 


On règle le problème du point A de la même manière qu’au paragraphe précédent. 
On fournit le programme tangent .c concernant cette procédure. 


2. Algorithmes accélérateurs 


(Voir le cours chapitre 2) 


3. Les développements asymptotiques 


3.1. Développement asymptotique 


Une première intégration par parties donne : 


1 ef 1 
f(æ) = | z exp(x J Je exp(x — t) dt = -— — Je exp(x — t) dt. 
z 
z T T 
En poursuivant ainsi les calculs on trouve : 
1 1 2 3 n! T ooa 
foi hr hic +D ft n=2 exp(z — t) dt. 


T 


Cette série diverge quand n tend vers linfini puisque le terme général devient infini quel que 
soit x. Calcul de l'erreur €, (x) lorsque l’on tronque la série après le terme d’ordre n + 1 : 


[ee] 
En(x) = (n +1)! fr"? exp(x — t) dt 
T 
mais étant donné que exp(x — t) < 1 car x > 0 et t > x on peut écrire l'inégalité : 


ee] 
1 n! 
En(x) < (n 1) [e2] dt < jetip 


et pour n fixé, on voit que l'erreur tend vers zéro quand x croît indéfiniment. 
La fonction y(n) = Fa est une fonction strictement positive quels que soient n et x; pour 
T 


l’'étudier, il est commode de lui associer la fonction Y(n) = log, [y(n)] : 
pin) = nlog.(n) -n — (n + 1) loge(x) 


dont la dérivée s’écrit ainsi : 


dy(n) 
dn 


= log,(n) — log, (x), 
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elle a un minimum pour n = N = x; cela signifie que la fonction w(n) a aussi un minimum. On 
va voir que c’est le même minimum. Pour x fixé, l’erreur sera minimum pour une valeur de no 
qui est approximativement donnée par légalité : 


Eno (x) = Eno+1(2), 


soit encore : 


ce qui donne no = æ — 1. Ce résultat n’est pas en contradiction avec ce qui précède, en effet x 
est une variable réelle tandis que n est une variable entière. On aurait masqué cette remarque 
en écrivant légalité €»,_-1(x7) = Eng(T) Car on aurait trouvé no = x. On aurait tout aussi 
bien pu écrire E£ng-1(£) = Eng+1 (X) qui aurait donné encore un résultat légèrement différent : 
æ = 4/no(no + 1) qui a une racine approchée de l’ordre de no = x ou no + 1 = &. 


a — Application de l'epsilon-algorithme — Le développement asymptotique étant un prolon- 
gement analytique, on peut s'attendre à ce que la convergence se réalise même si la condition 
précédente n’est pas vérifiée. Dans la mesure de la «calculabilité effective », on doit trouver des 
résultats corrects aussi bien pour des petites valeurs de x que pour de grandes valeurs de n. 
C’est ce que nous avons vérifié. 


b — Cas de la fonction erreur — Pour ce qui concerne la fonction : 
re : (—t?) dt 
rf(xz)=1— = —= | exp(— ; 
vaJ P 


on effectue une suite d’intégration par parties et l’on obtient : 


exp(—x?) 1 1-3 1-3-5 
cerf(x) = 1 — (x) = T/T [ 272 + 9274 93%6 


T pobi Ge D | 


2n— ly2n—2 


4. Résolution des équations numériques 


4.1. Voir le cours 
4.2. Voir le cours 
4.3. Calcul de la fonction arctan(x) 


Comme zo — arctan(xo) = 0, on peut ajouter cette quantité à l’équation x = arctan(a), soit : 
x = arctan(a) + zo — arctan(x) ou encore : x — £o = arctan(a) — arctan(xo) expression que l’on 
transforme ainsi : 


arctan[tan(x — to)] = £ — zo = arctan(x) — arctan(xo) 
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puis en développant l’expression de tan(x — zo}, soit : 


_ tan(x) — tan(xo) 
tan(x — zo) = 1 + tan(x) tan(zo) 


d'où : 


a — tan(xo) | S 


arctan 
È | + atan(xo) 


puisque l’on connaît a = tan(x). 
Cette dernière expression peut s’écrire formellement : 


x = zo + arctan[F(xo)] = £o + arctan( Fo). 


On développe la fonction arctan, on obtient : 


F3 F5 p2rr1 
OS ren der 


le rayon de convergence est | Fo] < 1. 


On se propose de calculer arctan (+) avec zo = 0,8. Donc : 


E V3/3 — tan(0,8) 


= "© = —0,283 661 987, 
ut: V3/3tan(0,8) 
ce qui permet de calculer la valeur numérique de 
F8 FŠ 
z= to + F — Fa T = 0,523 598 


entachée d’une erreur absolue de 2 107% qui est le premier terme abandonné de la série alternée 
fournie par le développement. 


4.4. Racine d’une équation f(x) = 0 


a — L’équation de la tangente en Ao s'écrit : y = f(xo) +(x — z0) f' (£0). L'équation de la droite 
orthogonale à cette tangente et passant par B s'écrit : y = —(x — xo)/f'(xo), on en déduit la 
coordonnée du point d’intersection : 


F(zo) f (£0) | 


T1 = Lo — 
1 + f’ (zo) 


À partir de zı on peut calculer z et ainsi de suite, d’une façon générale on aura : 


Flarf (ak) 
1+ f(x) 


Tk+1 = Tk 
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b-Onae, = X — x}, il s'ensuit que £n+1 = P(X — en) expression que l’on va développer en 
série de Taylor au deuxième ordre : 


d® e dọ 
Zn41 = P(X — en) = P(X)-— en T | a HE 
et comme (X) = X, on obtient au premier ordre : 
dë 
MSA) 
soit encore : 
dë 
n+1 = En — = ken 
En+1 — En dz e 


Pour que ce processus itératif fonctionne, il faut que les extremums relatifs dans A n’existent 
que sur la frontière de A, et f(x) doit donc être monotone dans A. En outre, il faut que f(x) 
soit continue dans A et qu’elle n’ait pas de tangente verticale (on dit qu’elle est lipschitzienne). 


dë 
c — Calculons k = Er En rappelant que f(X) = 0 (ou #(X) = X), après quelques calculs on 


trouve : k = Iy? ce qui montre que k est toujours plus petit que 1 et donc que le processus 
est toujours convergent à condition de ne pas sortir du domaine A. 


d — Ce processus est un processus du premier ordre, et, du point de vue de la vitesse de 
convergence, il est moins rapide que la méthode de Newton qui est un processus du deuxième 
ordre. En revanche, au voisinage d’une tangente horizontale, la méthode de Newton devient 
instable en rejetant très loin la valeur numérique de la suite des zn. La méthode proposée ne 
présente pas ce défaut en offrant une grande stabilité, cependant si l’on utilise cette méthode en 
particulier, il faudra plus que jamais terminer le programme par le calcul de f (£n) et vérifier que 
cette valeur est suffisamment proche de zéro. En effet, en examinant la formule de récurrence 
que nous avons établie, on peut s'apercevoir que cette expression permet aussi de calculer les 
zéros de la dérivée f'(x)... 


4.5. Racines d’un polynôme à coefficients complexes 


Il s’agit là d’un exercice très proche de la méthode de Bairstow. On écrit : 


P;(2) = (ao + jbo)z” + (où +481)! + (az + jb)? +--+ (on + jln) 
= Di(2)Qn-1(2) + ($ + jt) = [z — (p + jo) (Yo + jo)” T! + (1 + j1)? 
+ (Y2 + jô2)2" +0 + (qu 1 + Jôn1) + (P + jY). 


L'identification des termes est immédiate, on obtient : 


Yo = Qo ðo = Bo 
N = &1 + PV — aĝo ôı = bı + pdo + 00 


Va = Qq + PYg-1 — Cdg-1 ôq = Ba + Pdg-1 + OYg-1 


= Qn + PYn-1 = Oôn—1 y — Bn + Pôn—1 + OYn—1- 
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Bien entendu, comme dans la méthode de Bairstow, ® et Y sont des fonctions de p et ø, et 
nous voulons obtenir p et ø tels que : 


P(pia)=0 et  Y(p,o) = 0. 


Connaissant une première approximation pọ et vo on va chercher à calculer h et l en 
développant ® et Ÿ au premier ordre : 


osata +19 pour p = pọ et o = 00, 
Ô 
gogan iE pour p = pọ €t o = ©. 
ap ðo 
La résolution du système linéaire donne À et l; 
oY 0% 
= |ğ— — Y— | /det 
| ðo | E 
0 ðY 


= be an DA /det, 


avec dt=—.———-——.— 
p 


ces valeurs étant toutes calculées pour p = po et © = Go. 


Le problème consiste donc à obtenir : ®, Y, a 2, PA et 2%. Il reste à calculer les dérivées ; 


on calcule ensemble les dérivées par rapport à p puis les dérivées par rapport à ø. On a donc : 


ÔYk  Ox-1  _Oðk-ı ððk 06k-1 — OYk-1 
Op Ce öp j ðp Dp Terte öp TE p | 
On pose 
dr ðk 
D EN TRE 


ce qui permet d'écrire : 


tk—-1 = Yk-1 + ptk-2 — TUk-2 €t  Ug-1 = Ôk—1 + Pux-2 — Ftk-2, 


avec to = Yo et uo = ĝo. Ces relations aboutissent à : 


o + pt u et E Ôn1 + pu t 
— = Yn- 2 — TUn-— — = ôn- _9 — Oln-2: 
ôp Yn-1 T Pin-2 n—2 öp n-1 T Pün-2 n—2 
De la même manière, on calcule les dérivées partielles par rapport à a : 
0 _ gdr- | OI ðk m g + 0041 
ðo El ðs P 8o ðo = ðo P po 
On pose : 
IW = et O6 w 
3c = Uk—1 ðc m k—1; 
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ce qui permet d'écrire : 


Uk = —Üp-1 — OWk—2 + PUg-2 €b Wei = Yk-1 + CUk-2 + PWk—2 
avec vo = —00 et wo = Yo. Ces relations aboutissent à : 
o? OY 


ie —Ün_1 — OCUn-2 + PUn-2 et = = Yn-1i + OUn-2 + PÜn-2. 
ðc 00 


En partant de p = pọ et o = op, on va calculer la racine 20. Une fois cette racine connue on 
est en mesure de calculer les coefficients du polynôme Q,_:(2) puis d’en calculer une racine. 
On aboutira à la fin du calcul au produit de deux monômes dont on calculera les racines. 
Attention au calcul de la dernière racine car le dernier monôme se présente de la façon suivante : 
(Yo + jôo)z + (91 + jô1). 


4.6. Résolution d'un système non linéaire 
a — On peut toujours écrire ce système sous la forme : 
Ep = D, (di, £2, dada) avec p= 1,2,3,..., N. 
pour cela il suffit d'ajouter zp dans chaque membre de l'équation : 
Fp(£1, £2, 3, ..., En) + Ep = Zp = 0 une denim.) avec q= 1,2,3,...,N. 


b — On a les équations : 


xt) =%, o : Pi) | 


dont la solution exacte notée avec une étoile s'écrit : 
x ï k k k 
£y = Pp (L7, 13, 23,- -3 2n) = Pp G ) +6, zf ) +é, $ ) + és,- e tén) . 


Le développement au premier ordre des fonctions $, conduit au résultat suivant : 
n n 
* k) (k) „(k 0% 0 
r% = 0, (si ) af ) z$ et) + DE = pire + dé, 
j=1 Ôt; jz Ôz; 


d'où : 


& est l'erreur sur x, au tour k tandis que x, — fto est l'erreur au tour k + 1. Désignons cette 


k f 
erreur au tour k par ef ), Nous avons la relation entre les erreurs : 


(k+1} — 7 (k) 08 
Ep = 2 €; Öz; ; 


que nous pouvons écrire en fonction de la matrice jacobienne : 
Ekt) — MOEH., 


Il faut faire attention au fait que les matrices M(%) voient leurs valeurs changer au cours des 
calculs. Cependant le processus sera convergent si toutes les matrices MC) ont tous les modules 
de leurs valeurs propres inférieurs à 1. Il n’est pas aisé de réaliser cette condition. 

Pour améliorer la vitesse de convergence, on peut utiliser l’epsilon-algorithme vectoriel quand 
bien même la suite des vecteurs E() divergerait. 
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4.7. Résolution d'un système non linéaire 
a — Si (X,Y) est solution du système : 


f(æ;,y)=0 et  g(r,y) = 0, 


il l’est également de la forme quadratique : 


(x, y) = F°(æ,y) F g’(x,y) 


car on à f(X,Y) = 0 et par conséquent f?(X,Y) = 0 et de même pour la fonction g. Une 
remarque s'impose si (X, Y) annule (zx, y}, (X,Y) n’est pas obligatoirement solution du système 
primitif, car P(x, y) = 2f f +2gg' et ceci montre que l’on peut avoir d’autres racines que f = 0 
et g = 0 et quatre combinaisons sont possibles avec les dérivées. Il faudra donc bien vérifier ce 
point en reportant le couple (X,Y) dans les équations de départ. 


b — Partant d’une approximation (zo, yo) on va chercher d’abord à améliorer la valeur de x et 

l’on écrit : 

0 €? 07% 
(to + £, Yo) (x0, Yo) É Ej Dr? 


On cherche le minimum en écrivant que 3e = 0; cette relation impose que : 


pour x = zo et Y — Yo. 


ð o 
x — ‘or 
d’où la valeur de £ : 
oS 
z 
e= -— 2, 
ðr? 


par ailleurs, on peut toujours effectuer un calcul direct des quantités figurant dans l’expression 
de £: 


0 of ôg 

Ôx 23 F Ir 

P of d?g of ôg]? 
pi ðr? SE TA nr H ai E] 


On sait donc calculer zı = £o + £. 


c — Rien de fondamental n’est changé et il suffit de remplacer x par y et E par ņn dans les 
équations : 


avec : 
08 of Ôg 
ay T By Vo 
PË af d?g af? 8g]? 
et : a afa gaa] | +2] |: 


On sait donc calculer y = yo + 7. 
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d — On recommence l’ensemble des opérations avec les nouvelles valeurs zı et yı qui se 
substituent aux valeurs xo et yo. On calcule d’abord zz puis y2, mais rien n'empêche de faire 
l'inverse. On poursuit les calculs jusqu’à obtention de la précision permise par la machine sans 
omettre de réintroduire les dernières valeurs dans les équations primitives. 


4.8. Ordre d'un processus itératif 


La méthode dite par itérations fonctionne directement sur le schéma proposé : rx4+1 = (z4). 
La méthode de Newton est un peu moins directe : 241 = £k — ®(æx)/®'(xx) = Y(xx) mais le 
schéma fonctionnel s’applique sur la fonction (zp) associée. 

On écrit en+1 = X — n41 = X — f(xn). Il convient de faire disparaître x, de cette relation 
pour répondre à la question posée en notant que x, = X — en ; ainsi on écrit : 


En+1 = À — f(X — eh). 
En développant f(x) au voisinage de la racine X, on obtient alors : 


en df è f edf 
1! dx 2! dz? 3! dx 


En41 = À — F(X) +. ; 


l'expression se simplifie en remarquant que f(X) = X, soit encore : 


en df È Ëf Le df 


e Pe } e£ dt f 
MT dx 2! dr? 3! dz 


US id (pour r= X), 


qui est bien un polynôme en en dont les coefficients sont : 


1 d’f 1 df 
a= ir b = -3 de Y= a dz? pour x = X. 


1. Application à la méthode de Newton 


a — Ona (x) =0 et f(x) = x — [®(x)/S'(x)] et l’on calcule les coefficients a, 8 et y. 


p? -ap op” 
Begue ie ae pour xz = X, donc a=0 car ®(X)=0. 
1 æf 1 d pp” 1%” 
B=- e-a e (e)a pour x = X. 
D'où l'expression de l'erreur : 
en L'(X) 


En+1 = E &'(X) 


b — L'application sera contractante si 


2 


En 


2! 


len+1l < 
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2. Généralisation de la méthode de Newton - Ona: 


g(æ)®(x) 


CET DES CD 


Après quelques calculs qu’il convient de mener avec soin, on obtient les résultats suivants : 


Er 
de 
1 d?f 1 /B" 2h 
B = Mere (+2) pour r = X. 


Le processus sera du troisième ordre en choisissant les fonctions h et g de telle sorte que le 
coefficient b soit annulé, c’est-à-dire lorsque ”/®’ = -2h/g. 


4.9. Résolution d'un système de deux équations à deux inconnues. 
Méthode de Kacmarz (1937) 


1. a — Les coordonnées du point A:(x1,y1) sont données par les équations : 
ai(yı — Yo) — bi(x1 — to) =0 et air1 + big +a = 0 


dont la résolution donne : 


ai êi pa bi Rı 
yı Yo a? + a? 


£1 = Lo — avec  R1 = a1to + b1%0 + c1. 


b — Par le même procédé, on obtient les coordonnées de A2(x2, y2) : 


a2R2 bo R2 
T2 = T1 — a+ et Y2 = Yi — a+ & avec Rz = G2%1 + boy + C2. 
2. — On linéarise les équations comme il a été montré dans le cours, on écrit : 
of of 
h, D) = , h= +1 =0 
f(zo +h, yo +1) = f(£0, Yo) + Əz | dy 
0g , ,0g 
+ A, l) = g{xo, yo) + h- +1 =0 
g(zo + h, yo +1) = g(20, y0) +R ce 
et par identification on obtient : 
of Of 3g ðg 
= — b z= — ir = b + 
AT 9x i 0y 2 Jr Ôy 


De même que a1%0+b1yo+c1 Æ 0 si le point (x0, yo) n’est pas la racine, de même f(x0, yo) # 0 
si le point (zo, Yo) n’est pas la racine. On continue de désigner par R1 la valeur de f(&o, Yo) : 
Rı = f(xo, Yo). Rien n'est changé pour l'indice 2. On a les relations : 


aR biR 
et  Yk+ı = Yk 


Tk+1 = Tk — avec Ri = f(k, Yk) 


a? +a? a? +a? 
Tk+2 = T mae. et y y he avec R2 = g(tx+1, Yk+1) 
+2 = Tk41 — k+2 = Yk+1 — 2 = 9(Tk+1, Yk+1)- 
až + a2 až + aż l 
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Exemple 
f(x, y) = x? + 4y? — 36 = 0 
gx, y) = +? + y? — 19x + 27 = 0. 


On calcule aisément : 


Of Of 

_ =? = 
a Ôx bi ðy ` 

g _ ôg 
Be Sr LT 


5. Éléments de calcul matriciel 


5.1. Voir le cours p. 70 
5.2. Voir le cours p. 378 
5.3. Résolution d'un système linéaire volumineux 


La matrice A; possède l lignes et kı colonnes, la matrice A> possède {1 lignes et N — kı colonnes, 
la matrice A3 possède N — l lignes et kı colonnes et enfin la matrice A4 possède N — { lignes 
et N — kı colonnes. Les vecteurs X1 et Bı sont à 4 lignes, et les vecteurs X2 et B2 à N — 
lignes. 

Pour que l’opération proposée soit possible, il faut que lı = kı, donc que les matrices A: et 
À4 soient carrées. La première équation donne : 


X1 = AT [Bi ~ AX], 
valeur que l’on substitue dans la seconde équation : 
AzA [B1 — AXo] + A4Xo = Bo. 
Cette équation peut encore être transformée de la manière suivante : 
[A4 — A3A1 A2] X2 = Bo — A3A; Bi, 
ou encore : 
[A3 A5 A — As] Xo = 4347 Bi — Bo. 


Pour calculer X2, on réalise la suite des opérations : 
. Inversion de À; en AT, 
. Multiplication de At et À) soit A7, 
. Multiplication de 43 par le résultat précédent, soit 4347 LA. 
. Soustraction de la matrice A4 au résultat précédent, soit A3A7 14 — Aa, 
. Inversion de la matrice précédente, soit [A3A, "A> — A,]°1, 

. Calcul de A DS 
. Multiplication de A; par le résultat précédent, soit AzA B, 
. Soustraction de B2 au résultat précédent, soit A3A7 1B; — Bo. 
. Multiplication du résultat précédent par le résultat du 5. 


© D I OO Cr & À ND 


On obtient X», et l’on peut donc calculer A2X3, expression que l’on retranche de Bı, il ne 
reste plus qu’à multiplier A par ce dernier résultat pour avoir la valeur de X4. 
Le programme grosys.c effectue les calculs proposés par cette procédure. 
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5.4. Résolution d’un système linéaire par la méthode itérative de Jacobi 


a — Transformation de la matrice A’. On divise chaque ligne par l'élément qui est sur sa 
diagonale, si un des éléments de la diagonale est nul, il suffit de permuter deux lignes pour 
réaliser l'opération : elle est toujours possible puisque la matrice A’ est inversible, sinon cela 
voudrait dire que le déterminant est nul. Après cette transformation, désignons les éléments de 
À par ax et l’on a : ax = ag/al, sil Æ k et ay = 1. On obtient la matrice M aisément, ses 
éléments sont : myx = ax si l Æ k et mu = 0. Les composantes de B s’écrivent simplement : 
bı — b/a- 


b — On a la relation : [I — M] X = B, soit encore X = B + MX expression qui se transforme 
en processus itératif, à savoir : 

Xk+ =B+MXk 
que l’on peut initialiser avec Xo = 0. On obtient la suite : 


X =B, 
X2 =B+MX\=B+MB-[I+MI]B, 
X; =B+MX=B+MB +M?B, 


Xnu=B+MXn=B+MB+...-+M°B=I+M+...+M"]B. 
Si n est infini ou simplement très grand, on peut alors écrire que : 


or: 
| I-M 


I+M+..+M"+4... 


et si l’on désigne par Z la limite de X,, on retrouve naturellement que : 
Z- M]Z =1B=B, 


mais Z ne sera la solution effective que si l'algorithme est convergent, c’est-à-dire si les valeurs 
propres de M sont de module inférieur à 1. Ceci n’est pas tout à fait exact, car même si la suite 
des Xn diverge, on peut néanmoins faire appel à l’epsilon-algorithme vectoriel pour ramener les 
choses en l’ordre. C’est ce que réalise le programme jacobiO.c. 


5.5. Résolution d'un système linéaire dépendant d'une matrice symétrique 
(méthode de Choleski) 


1. a — On écrit : A = LS, la décomposition étant explicitée dans le chapitre 5. 
On obtient : AX = LSX = B d'où SX = L 1B=Y. 


b — L’explicitation de la dernière équation donne : 


1 S12 S13 S14 zı yı 
0 1 s23 sa T2 y2 
0 0 1 53 Ta] = |Y3 
0 0 1 T4 Ya 
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On obtient les valeurs successives de £n, Zn_1, Zn_2 et ainsi de suite jusqu’à x: en écrivant : 


Tn = Yn 
Tn—1 = Yn-1 — Sn-intn 


k—1 
En-k = Yn—-k — X sn-hn-p?n-p avec k —0,1,2,...,n—1. 
p=0 
c — On écrit sans difficulté : 
lı 0 0 0 OÙ ln bi 
la l2 0 0 0! lu b2 
l31 32 l3 0 OÙ - lys] = |b3 
lun l2 la ls 0) lya ba 
d’où l’on déduit : 
y — bi 
nr 
1 k—1 
et Yk = — br — X. lkpYp avec k —1,2,3,...,n. 
lkk Pan 
d — On écrit simplement : 
lı 0 0 0 0 1 0 0 0 0! Idu 0 0 0 0 
lı lba 0 0 0! la 1 0 0 0 0 d 0 0 0 
lai l32 l33 0 0 À31 À32 1 0 0-10 0 d33 0 0 
lai Lao las lu OÙ fAs Aa Asg 1 0 [0 0 0 dy 0 
ce qui permet d'écrire : 
hi= du, la = And, :.. dj = ÀAjidu. 


En définitive, la colonne 1 est divisée par d11 = l11, la colonne 2 par d22 = loz et ainsi de suite. 
On réécrit la matrice À de la façon suivante : 
A = LS = (AD)S et comme D est diagonale, A = A(DS). 


2. a — Puisque la matrice À est symétrique, nous écrivons que la matrice À est égale à sa 
transposée, soit : A = AT. À partir de À = LS = A(DS), on écrit la matrice transposée de À : 
AT = ST DAT ; car DT = D. On en conclut que : À = ST et que AT = S. 


b — Puisque A = ST, on en déduit que : À = AT = STDS = ADAT. On peut encore écrire : 
A = AVDVDAT = MMT en posant M = AVD et on a également : ôu = vdu, pour l = 
1,2,3,...,n. 
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c — L’équation À = MMT donne les relations suivantes : M, = ayı puis MaiMai = 412 et plus 
généralement : Mami = au pour l = 1,2,...,n. De là nous déduisons la première ligne et la 
première colonne : 


; ail 
Mi = yai puis Mu = a pour 1 —=2,3,4,...,n. 
11 


On passe à la deuxième ligne et la deuxième colonne au moyen des équations suivantes : 
m = az — m3, et plus généralement : Mk2M22 + MkıM21 = a2x pour k = 1,2,...,n, dont nous 


déduisons : 
Q2k — Mk M21 
= / 2 = 
Mo2 = +4/ a22 — M31 et Mk? = ————————— : 
M22 


Ce calcul se généralise aisément : 


l—1 
alk — X MakMak 
q=1 


mu 


— 2 
Mkk = E, | Axk — J Mpk et Mik = 
=1 


d — Après avoir calculé les myx on calcule les y, du paragraphe c en écrivant : Y = MB. 
On résout ensuite X = M!Y en faisant usage des relations établies au paragraphe b. Bien 
entendu, dans les relations établies aux paragraphes b et c, on remplace les sy par les my et 
les lı par les mu. 

On trouve sur le Web (*) le programme choleski.c qui réalise l'algorithme étudié. 


5.6. Résolution d'un système linéaire par la méthode du gradient conjugué 


Nota - Pour éviter de commettre quelques confusions, tout au long de ce problème, les vecteurs 
sont notés en caractères gras. 


1. — Soit e; une base orthonormale à N dimensions, 
N-1 
le vecteur p de composantes pp s'écrit : p = piei 
i=0 
N-—1 
de même le vecteur q s'écrit: q = dei 
i=0 
N-IN-1 
le produit Aq s'écrit : Aq = age 
1=0 k=0 
et le produit scalaire s'écrit : 
N-IN-1 
(p, Aq) = axgkpi = (q, Ap) = (Ap, q) = (Aq, p). 
1=0 k=0 


2. a — Comme A est une matrice définie positive, (Ap;,p;) > 0 si p; # 0 et (Ap;,p;) = 0 si 
Pj =0. 


*http://wwuw.edpsciences.com/guilpin/ 
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b — Les {p;} sont linéairement indépendants et forment une base de l’espace à N dimensions. 
En effet, (Api, pj) = 0 si i Æ j et (Api, pi) > 0. S'ils étaient linéairement dépendants, il existerait 
au moins un k qui donnerait (Api, px) > 0 ce qui est contraire à l’hypothèse. 


c — h étant un vecteur de l’espace à N dimensions qui est solution du système AX = B, il peut 
s'exprimer comme une combinaison linéaire des vecteurs de base p; : 


Calculons les c; : 


N-1 


(Ah, pr) = (B, pk) = (4 5 app) = Ck(APk; Pk), 


i=0 
et donc on a : 


(B, Pk) $ 


€ dax 
E (Apr; Pk) 


Comme 


N-1 
B, 
h = Bm) Pk, 


2 (Apr, Pk) 
on forme la suite de vecteurs Xxj+1 = xj + c;pj en commençant par Xo = Copo 


3. a — On a (Apo, p1) = 0 = (po, Ap1) avec pı = V1 + Qiopo, soit encore : (Po, AVı + @10P0) = 
0 = (po, Avı) + @10(po, Apo) car po = Vo. On en déduit : 


2i (Po, Avı) à 
(Po, Apo) 


Plus généralement, le procédé d’orthogonalisation consiste à écrire : 


@10 = 


k 
Pr = Vk + DC 
j=0 
ici encore les produits scalaires : (APk+1, Pj) = (Px+1, Ap;) = 0, avec j = 0,1,...,k, permettent 


de calculer les (k + 1) coefficients ax41,; et l’on trouve : 


a QE _ (Avks1, Pi) l 
de (AP; Pj) 


Ensuite, on peut écrire tout simplement que Vk est une combinaison linéaire des pj pour 
, a ok FR . ; 
j3=1,2,...,k:w= > =0 dx,;P;, il s'ensuit que : 


k 


(vio Api) = (Avi, pi) = X` dx;(Apy pi) = 0 si j>l, 
j=0 


car les {pi} sont A-orthogonaux. 
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b — Si A = I, alors les vecteurs A-orthogonaux deviennent orthogonaux, car : 


(Apk, pi) = (px, p)=0 si kÆ#l. 


Ensuite, on pose : 


k—1 


Pir = Pk + Z Ykt1,jPj + RL EVIL. (1.1) 
j=0 


Dans le cas où 7j < k + 1, le produit scalaire (Pi15 Pi) s'exprime ainsi : 


(Piti: Pi) =0= Yk+1,j (Pj; Pi) + 41,8 (Var, Pi), 
d’où : 
4 X (Vk+1; pj) 
k+1,j = Yk+,k TT ` 
j (Pi Pi) 


On obtient 441,4 en faisant (Pky1 Pk) = 0 = (Pio Pk) + k+1,k(Vk+1, Pk), Soit : 


Yk+l,k = Bei) 
i (Ven PL)” 


de là on tire l'expression de Yk+1,; : 
+1,j 


_ _(Pi- Pk) (Vx+1, Pi) 


4. a — La suite {r;} est orthogonale. Posons : vx}1 = Apr et Pi = rx, puis remplaçons dans 
l'équation (I.1) : 


k—1 
LTÉE (Abu; rj) Ee Apk 
J 


rkp = rk t 7a Apr ru / Fst 
j=0 J?” 


mais la somme est nulle puisque k > j. Par conséquent : 
rk 
(Apr: Tk) 
qui constitue bien une suite orthogonale puisqw’elle obéit au processus de formation de l’équa- 


tion (I.1). Par un procédé analogue, on démontre que la suite des px est A-orthogonale. Pour 
cela, on pose dans l'équation (H.7 p. 457) vk = rx puis partant de : 


Tk+1 = rk — AP 


(Avi+1, Pj) 


Pi = Vi + DCR avec i+2<N, et Qij = — [Ap p) 
PFJ 


j=0 


on obtient l'expression : 


(Ari+1; Pi) = (ri+1, Ap;) 
PT a > (App T Io (App) 7 
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Montrons que (Ari, px) = (Apk, r) =0sii>k+1: 

En effet, la suite des {pi:1} est construite par A-orthogonalisation de ro,r1,r2,..., laquelle a 
été construite par orthogonalisation de ro, Apo, Ap1,..., Api. Comme cette dernière suite a été 
formée à partir de l'expression (H.8 p. 457), alors l'expression (vx, Api) = 0 avec į > k est vraie 
en faisant À = I et en remplaçant Vk+ı par Apr et p; par ri; on peut écrire alors : 


(Vxx1, Api) =0 sii>k+1 soit encore (vx;1,pi) =0 et (Apu,ri) = 0, 
soit en définitive : 


B (ri, Api) 
Pi+ı — rip (Api, pi) Pi. 


b — Le maximum de tours d’itération est N, ordre du système linéaire. 


5. a — E?(x) = [A(h — x),h — x] qui n’est rien d’autre que le carré A-scalaire du résidu donc 
comme À est définie positive, cela entraîne que E? (x) > 0. 


b — Développons le calcul de l’erreur : 


E? (xj + l;p;) = [A(b — x; — l;p;), h — x; — l;p;] 
= [A(h - x;),h — x;] — [A(h — xj), lipj] — [A(l;p;), h — x; — lp; 
= E? (x;) — 1;[A(h — x;), pi] — l; (4p;, h — xj — l;p;)- 


Puisque Ah = B, on pose r; = B — Ax; = Ah — Axj, il s'ensuit que : 
E? (x; + ljpj) = E? (xj) — 2l; (£j, pj) + É(Ap;, pi). 
Dérivons cette dernière expression par rapport à l; pour obtenir le minimum de E? : 


dE? (xj + Lpi) — 


; —2(rj, pj) + 2l; (Apj, pj) = 0, 
dl; 


on obtient alors la valeur de l; : 


z (ri Pi) | 
7 — (Api, Pi) 


Explicitons le dénominateur : 
(ri pi) = (B, pi) — (xj, Apj). 


Montrons que le dernier produit scalaire est nul; en effet, xj est une combinaison linéaire des 
{pi}, donc (r;,p;) = (B, pj), et l’expression des lj devient : 


(B, pi) 
L = ~ =c. 
7 (Ap;, pi) $ 


On voit que chaque itération j rend E? (x) minimum selon l’axe des pj passant par le point 
zj. Le minimum minimorum est atteint pour x = h et alors E?(x) = 0. 
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6. — Dans le cas où la matrice n’est pas définie positive, alors on peut multiplier à gauche les 
deux membres de l'équation Ax = B par la matrice transposée AT. Ainsi : 

AT Ax = ATB, dans la mesure où la matrice A n’est pas singulière, on est ramené à l'étude 
précédente. 

La procédure présentée est concrétisée par le programme gradconj.c. 


5.7. Calcul direct des coefficients du polynôme caractéristique 


a — Nous avons : 
Pa (à) = Pa (0 }+ AP’ (0) + à À Pr (0) + +2 À PRO = Dan 


il s'ensuit que : 


ensuite, On a : 


Pa (0) = -£ DM a — Az) = AD NS Akr]. 


j=1 j=l k>j 
c — Cette expression se généralise de la façon suivante : 


n n 


ZPO = | PS NE SO de man 


j=1 k>j p>qm>p 


pour aboutir aux expressions terminales : 


M 


1 N n m 
C PZ »(0 D): DD De 35,kk,...,pp,n—1n— 1)] = D 


j=1 k>j p>q n—1l 


= 


où l’on a noté par aik les coefficients de la matrice A. 


d — Par un examen direct de (H.10 p. 459), on peut écrire : 
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e — On obtiendra les valeurs propres de À après avoir obtenu les coefficients du polynôme 
caractéristique. Pour obtenir ceux-ci, il peut être habile de confectionner un programme récursif 
(mais cela n’est pas indispensable) puisque le calcul d’un déterminant d'ordre n est une 
combinaison linéaire de n déterminants d'ordre n — 1. 


5.8. Calcul des valeurs propres d’une matrice réelle et symétrique par la méthode de Jacobi 


a — On a AX = ÀX puis on fait X = TZ ce qui donne ATZ = ATZ. Multiplions à gauche 
cette dernière équation par T~! : T7 ATZ = T-IATZ = AZ. On voit que la matrice T—!AT a 
les mêmes valeurs propres que À mais pas les mêmes vecteurs propres. 


b — Puisque À est symétrique, ses valeurs propres sont réelles, donc À est diagonalisable. 


c — T est symétrique par construction, T~! est symétrique aussi car (T° !);; = K;;/A où K;; 
est le cofacteur et le À déterminant qui se réduit à un déterminant d’ordre deux : 


cos(g)  sin(ç) 
sin(g) —cos(o) 


donc qui vaut —1. On vérifie bien que TT = I (matrice unité d'ordre n). 


d — Écriture des éléments de (AT), seules les colonnes p et q sont changées dans la matrice À : 


colonne p colonne q 
aıp cos( Y) + arq sin(p) o aip sin(p) — aq cos( p) 
azp cos( p) + az sin(p) 7. azp Sin(g) — az cos(p) 
aip cos(p) + ay Sin(p) a ap Sin(g) — a cos(p) 
anp COS(P) + Ang Sin(g) sas anp Sin(£) — anq cosp) 


e — Les éléments de (TAT) sont les mêmes que ceux de (AT) à l’exception d’une part des 
lignes p et q qui sont remplacées respectivement par la colonne p et la colonne q et des éléments 
à l'intersection des lignes p et q et des colonnes p et q d'autre part ; ces derniers deviennent : 


bpp = app cos? (p) + apg Sin(p) cos(p) + agp sin(p) cos(p) + aqq sin? (4) 
bag = app Sin? (p) — apq Sin( p) cos(p) — agp Sin(p) cos(p) + aqa cos? (p) 
bpa = app Sin(p) cos( p) — apq cos? (p) + apg sin? (p) — aqq Sin( p) cos( 4) 


bap = bpa» 


N 


puisque À est symétrique, B = (TAT) est aussi symétrique. 


f — On veut que byp = bpq = 0. Soit : (app — aqq) sin( p) cos(p) = apqlcos? (p) — sin?(@)], ce qui 
donne : 


2@pq 


tan(2ç) = =7, l'angle y appartenant à ( 2 =) . 


Pa 


App qq 


Il convient à présent de calculer sin(y) et cos(w) en fonction de 7. Nous avons : 


sin(2v) = T cos(2v) 
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que nous élevons au carré et nous obtenons : 


et cos(2p) = avec € = signe der, 


ET 1 
in(29) = ————— — 
0) V1+72 V1+7? 


de là on tire : 


g — Comme la matrice B reste symétrique, on peut opérer sur elle au moyen des transformations 
TBT dont le résultat est toujours une matrice symétrique. 

Adoptons une notation pour simplifier l'écriture : Bis Tpa Bk Tpq pour p < q, q variant de 
2 à n. k est l’ordre d’itération, en effet, ayant réalisé une fois opération « la nouvelle matrice 
B » n’est pas diagonale et l’on doit réitérer l'opération jusqu’à ce que les éléments non diagonaux 
soient suffisamment nuls à une précision définie à l’avance. La fin des itérations dépend aussi de 
la matrice À et de son ordre. 

Dans le cas particulier où app = aqq, la méthode ne tombe cependant pas en défaut, car on 
calcule directement la valeur des fonctions trigonométriques : 


v2 V2 
sin(p) = ÉS cos(g) = 9 avec € = signe der. 


h -— Convergence de la méthode - La somme des carrés des valeurs propres de À est un 
invariant dont on sait calculer la valeur : 


n n 


FOSE = Trace (AA) DT 


k=1 k=1 l=1 


on cesse les itérations lorsque la somme des carrés des éléments diagonaux de la matrice BF est 
suffisamment proche de S?. 


i — Nous avons les relations : 


bag + bpp = App + Aqq (1.2) 
bpp — baq = (App — aqq) cos(2) + 2apq Sin(24) (1.3) 
2bpq = (app — aqq) Sin(2p) — 2apq COS(26) (1.4) 


puis on fait (I.3) au carré plus (1.4) au carré et l’on obtient : 
(bpp — bag)? + 4b%q = (app — agg)” + Aa; 


et l’on combine cette dernière équation à (I.2) élevé au carré, puis en tenant compte du fait que 
bpg = 0, on peut écrire : 


2 ar Teng 2 2 
bja T bop = Aqq + app + 20 pq 


La somme des termes diagonaux augmente de 2a2,. Mais, comme la somme de tous les termes 
au carré est une constante, la méthode provoque l'accroissement de la somme des carrés des 
éléments de la diagonale et la diminue hors de cette diagonale de la même quantité. La méthode 
est donc convergente sans condition. 

Le programme jacobii.c met en œuvre cet algorithme. 
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5.9. Calcul des valeurs propres d'une matrice par la méthode de Souriau (1948) 
a — Nous avons : 
Ba = AT + a AT! + aA? +... + al 
Bou = ANT + a1 AT + a AT + + agy I = ACAS + a AT + a AT? + 2 + ag) + ag+11 


d’où la relation de récurrence : B,41 = AB, + aq411, et si q = 0, Bı = ABo + aI, avec la 
relation de définition qui impose : Bo = Z. 


b — La démonstration est dans le cours. On a : 


1 


ak = -7 [SĂ + a SĂ} + a287? +... H ax 18], 
avec S™ = 5y a7 = Trace (A™), 
j=1 


où les {À;} sont les valeurs propres de A. Donc : 
ak = _ {Trace (AŸ) + a Trace (AF7!) + a2Trace (AF7?) +... + ax_1Trace (A)} 
= =} Trace {AF +a AET! + ag A sé ax-1A} 


= -7 Trace {A(A*7 +a AFT? +a AFT H ak-11)} = — = Trace {AB} ; 


Remarque : B, = A” + a A”! + a24”? +... + anI = 0 d’après le théorème de Cayley- 
Hamilton. 


Le programme souriau.c exploite cette procédure. 


6. Interpolation 


Les exercices proposés sont traités dans le cours p. 89 et suivantes. 


7. Intégration des équations différentielles dans le champ réel 


7.1. Étude d'un pendule de longueur variable 
a — Appliquons le théorème du moment cinétique, nous obtenons : 
i a20) = —glsin(0), 
dt 
d’où : 
d?8 


dô ' 
l-2 + 2v- + gsin(8) = 0. 
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b — Lorsque 9 est petit nous pouvons écrire : 
d'0 dð 
l 2 0 = 0, 
de t#æTs 
et comme l = lo + vt, nous pouvons exprimer l’équation différentielle en fonction de la variable 
l (di = v dt) : 


d? 2 dô 
roa 
sur le plan numérique, on est amené à résoudre le système : 
d0 
u £ 


=0, 


= 0 
di 19 Joe 


= 0 rds_!. Le programme 


T d 
avec les conditions initiales au temps t = 0 : 0 = 200 rd et 7 
penduleO.c réalise cette procédure. 


7.2. Système électromécanique dépendant d'une équation de Mathieu (1835-1890) 


La charge q(t) sur le condensateur obéit à l'équation différentielle classique : 


d4 pdg a 
L-g teuto” 


soit en effectuant le remplacement de la valeur de C : 
d?q 


d 
+ RC + gli +esin(wit)] = 0. 
Il suffit de poser : 


a, 

dt 

di R, 1 ; 

Era K Lo [1 +esin{(uit)]. 


Il convient de choisir le pas temporel h petit devant les périodes To = 2r yV LCo et T1 = 2r /w1. 
Compte tenu des grandeurs numériques proposées, on doit trouver un courant oscillant qui croît 
indéfiniment. Il ne faut pas croire que les principes de la thermodynamique sont violés, le moteur 
qui fait varier le condensateur fournit l'énergie. 

On trouvera le programme mathieu.c qui concrétise cet algorithme. 


7.3. L'équation de Van der Pol (1889-1959) 


Il s’agit d’une importante équation de la physique concernant la synchronisation des systèmes 
oscillants. Elle présente aujourd’hui toujours un intérêt dans la mesure où c’est une équation non 
linéaire. Son étude s’effectue dans l’espace des phases (l’abscisse est la coordonnée d’espace et 
l’ordonnée la dérivée par rapport au temps de la coordonnée d’espace) et l'équation différentielle 
s'écrit : 
d'y 
dt? 


d 
2e(1 — ÿ) z +y=0. 
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On décompose cette équation du deuxième ordre en un système de deux équations du premier 
ordre : 

dy dx 

ET 
Au temps to = 0, on se donne zo et yo quelconques, valeurs que l’on fournit au programme de 
manière conversationnelle car il convient d’observer les courbes de l’espace des phases pour 
différents couples de zo et Yo ainsi que pour différentes valeurs de €. Il suffit d'utiliser les 
programmes proposés dans le cours en choisissant convenablement le pas dt; il est nécessaire 
de l’adapter pour chaque valeur de €. 

On doit observer que, pour une valeur fixée de €, quelles que soient les conditions initiales (xo 
et yo), toutes les trajectoires admettent le même cycle limite, que le point figuratif initial (£o et 
Yo) se situe à l’intérieur ou à l’extérieur de ce cycle limite. Cela signifie que, si un système obéit 
à cette équation différentielle, au bout d’un certain temps (transitoire), ses oscillations seront 
synchrones. 

Le programme vanderp. c réalise les calculs proposés. 


7.4. Intégration d'une équation différentielle du premier ordre par une méthode itérative 
(prédiction-correction) 


a — L’équation différentielle suivante : 
dy/ dz = f(x,y) 


pour x appartenant à (a,b) admet une solution unique qui prend la valeur yọ pour la valeur 
zo = a si les conditions des théorèmes d’Arzelà et de Cauchy-Liptchitz sont vérifiées (cf. le 
cours). 


b — Le résultat est immédiat : Yn41 = Ym-1 + 2hf (Em, Ym). 


c- On pose : 


on 
v= f | £o 2° Y0 2" 
w = f(£o + h, Yo + hv) 


h 
et l’on obtient : yı = Yo + AC + dv +w). 


d — On écrit la relation de définition : 
h 
ya = y + s |s (40) +f (ami: Y1) 


pour m > 1. On obtient la formule d’itération : 


EED = 00 + 5 [A (om) + F (amia )]. 


e — On cesse les itérations lorsque : 
(k+1) (k) 


Ym+i En Ym+1 
(k+1) 
Ym+1 


< 1077, 


107% étant la précision relative retenue. 
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f — Éventuellement, dans le voisinage du point £m, on adapte le pas h de telle sorte que la 
relation h < 2/M avec M = sup|0f/Ox| soit vérifiée. On peut estimer M de deux façons, la 
première consiste à dériver formellement la fonction f et la seconde à calculer numériquement 
la valeur de la dérivée. 


g — Pour la prédiction on écrit : 


(k) 
Ym+1 Tm+l 
k k 
J dy = ya -v&i = J fe, y(x)] dz. 
y) Tm—1 
m—i 


Il reste à calculer l'intégrale de droite, que l’on désigne par Im, et l'erreur que l’on commet sur 
l'estimation. Pour simplifier l’écriture, on pose (tm) = f[£m, Y(Tm)], on a alors Im œ~ 2hp(tzm) 
qui est l’approximation donnée par la formule de prédiction. Développons-la autour du point 
Lm—1- 


Im © 2hp(tm_1 + h) = 2hp(tm-1) + 2h p'(tm 1) + RD" (tm 1) ++: 


Désignons par (x) la primitive de p(z), son introduction va nous permettre de calculer 
l'erreur sur J. Pour cela écrivons l’expression rigoureuse de I puis effectuons le développement 
de l’expression trouvée autour du point T1 : 


4 
Im = (Em1 + 2h) — (m1)  2hp(Tm-1) + 2h°p'(Tm_1) + n°0" (Em1). 
Maintenant on obtient l’erreur em sur Im : 
h? {4 
Em = zf (£) 


avec £ appartenant à (£m-1, Tm+1). Comme d’habitude, on cherche une majoration de |f” (x)| 
dans l'intervalle considéré. Pour ce qui concerne l’erreur de correction, on a : 


h 
Ym+1 = Ym + g (Sm Ym) + Frs tel 


et l’on reconnaît la formule des trapèzes sur laquelle nous avons déjà effectué le calcul d’erreur : 


h3 
Em = m7 6), 


avec £ appartenant à (£m—1, Tm+1). On note que les deux erreurs sont localement en hÿ. 
Le programme predcor.c réalise cet algorithme. 


7.5. Étude d'un phénomène transitoire obéissant à une équation différentielle du premier ordre 


1. a — On trouve tout de suite la solution particulière y = 1/10, puis la solution de l'équation 
sans second membre y(t) = aexp(—50t), et enfin la solution générale : 


1 
y(t) = aexp(—50t) + —, 
10 
et la condition initiale permet de déterminer a, soit : a = 1/10, ce qui donne 


v(t) = glexp(-506) + 1, 


quand t varie de 0 à l'infini, y(t) varie de 0,2 à 0,1. 
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b — La méthode d’Euler s'écrit simplement : yg41 = Yk + hf(yx, tk) soit encore : 
Yk+1 = —1,5yr +0,25 puisque h = 0,05. 


Pour t = 1, on obtient y = 332,63 et pour t = 2 on trouve y = 1 105 733,3 alors que le calcul 
direct de la solution analytique donne la valeur 0,1 pour t = 1 et t = 2; il s’agit de la valeur 
asymptotique de la solution. Pour obtenir une valeur numérique raisonnable, il faut prendre un 
pas h petit devant la constante de temps T = 1/50, disons par exemple h = 7/10 = 0,002. Alors 
pour t = 1, on trouve y = 1,000 000 005 x 1071. 


2. a — On obtient : 


t2 t2 


t2 
fve exp(Dt) dt = -D f y) exp(Dt) dt +f exp(Dt) dt. 
tı ti ti 
Intégrons par parties le premier membre, il devient : 


t2 t2 


J y' (t) exp(Dt) dt = [y(t) exp(Dt)]2 — D f y(t) exp(Dt) dt, 
ti 


ti 
il s'ensuit que : 


t2 
A EE T ET E O E | s(t) exp(Dt) dt, 
ou encore : 


gts) = yeeo Dit — t)] + f s(t) exp[D(t — t2)] dt, 


qui est l'expression recherchée. 


b — À présent, 


(t= tı)" 
s(t) = >; lue avec u= to = ti. 


N 
k=0 


Alors T s'écrit : 


et en posant 
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On à : 


N 
TE X akCr. 
k=0 


On calcule immédiatement Co : 
t2 
Co = f exp[DE #2) dt = 51 — exp( Du 
tı 
puis on établit la relation de récurrence entre les Cp, en intégrant l'expression de C4 par parties : 


t2 


Hais Í (t — t1) exp[D(t — t2)] dt 


tı 


en posant u = exp|D(t — t2)] et dv = (t — tı)! dt. Tous les calculs faits on trouve : 


o_u _ 1 11 GG), 
T So CS D Ce me CEE 7 


Étude du cas N = 1 - On a Ti = tz et To = tz — (t2 — t1) = tı, il s'ensuit que nous avons 
alors : 


Par ailleurs nous pouvons écrire : so = s(To) = ao et sı = s(T1) = ao + a1, relations qui 
donnent ao et aı en fonction de so et 51 : ao = So et a1 = Sı — 50, on obtient en définitive 
Péquation (1.5) : 

y(Tı) = y(Do) exp(—Dy) + (Co — Ci1)s0 + Cis1. (1.5) 
Application numérique : Co = 0,018 36 et Cı = 0,012 66, puis y(1) = 0,099 955. 


Étude du cas N = 2 - Comme on a Ts = tz, T) = tı et To = 2t; — to, il s'ensuit que nous 
pouvons écrire : 


s(t) = ao + 


t-t 
a1: 
2 


t-t 
Les calculs étant menés comme précédemment on obtient : 

ap = 51 et  @ = (s2— Sso)/2 et az= 52 + Sp — 251, 
d’où l'équation (I.6) : 


Cı 


y(T2) = y(Tı) exp(—Du) + (c = à) so + (Co — 2C2) s1 + (c + 2) s2. (L6) 
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3. Généralisation de l'équation (1.6) — On reprend la relation (1.5) dans laquelle on effectue le 
changement sı = 8(T1) = s[y(T1), T1]. On fait donc d’abord sı = so pour obtenir y(T1) que l’on 
reporte dans l’expression de sı. Alors, on peut itérer jusqu’à ce qu’on obtienne une précision 
souhaitée à l'avance 10” par exemple en erreur relative. On connaît donc Ti et y(T1) à l'issue 
de ce calcul. On va poursuivre de la même façon avec l'expression (I.6) pour obtenir tz et y(T2). 

Au départ, on choisira s2 = sı et l’on calculera alors y(12), valeur qui sera reportée dans 
l'expression de 52. On poursuivra les itérations de la même manière que celle indiquée au début 
de ce paragraphe. 


Description de la procédure d'itération — On établit une plate-forme de calcul avec la 


relation (1.5) que l’on itère suffisamment, puis on continue les calculs en itérant la relation (1.6). 


7.6. Problème de la poursuite 


Désignons par z(t), y(t) et vo les coordonnées cartésiennes et la vitesse du jardinier, puis par 
X(t), Y(t) et Vo les coordonnées cartésiennes et la vitesse du chien. Nous pouvons écrire : 


dX]? [ay]? 5 
Pa) ta = 


dX À Y Te 
ae HT e fe 


d’où : 


ainsi que : 


2 2 
dz|” | dy 2 
T = Vp. 
dt dt i 
Par ailleurs, nous savons que le chien se dirige en permanence vers le jardinier, nous pouvons 
alors écrire : 


dY _ Y-y Tsi dY Y-y dX 
dX X-rz dt X-rzr dt 
On écrit l'équation horaire du jardinier : 
x =acos|f(t)] et y = bsin|f(t)] 
dx d 
= af (isi O et = bfe) cosl) 


d’où 


De là on tire que f’(t) est une constante et par conséquent que f(t) = wt + p, ce qui donne : 


Fo 
w= o 
a? +b? 


et y = 0 (condition initiale). Donc, à t = 0 : y = —bcos(wt) et x = asin(wt). 
Il faudra prendre garde au signe de dY/ dt ainsi que celui de X dans l'exécution des calculs 
et l’on devra prévoir des tests pour affecter les bons signes. 
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8. Intégration des équations aux dérivées partielles 


8.1. L'équation de Laplace, les isothermes d’un réfrigérateur 


Le travail ne présente pas de réelles difficultés, et l’on trouvera un programme qui traite ce 
problème et qui s’appelle refrig.c. 


8.2. Refroidissement d'une sphère homogène 


Le problème admet la symétrie sphérique et nous employons donc l’équation de Laplace 
en coordonnées sphériques dans laquelle nous ne conservons que les termes qui dépendent 
uniquement de la coordonnée spatiale r. Une remarque importante s'impose : nous ne pouvons 
pas calculer directement la valeur de la température au centre de la sphère car une discontinuité 
artificielle est introduite par le formalisme. En effet, le champ de température est parfaitement 
continu, mais le choix du système de coordonnées introduit une discontinuité au centre puisque 
l'équation fait apparaître un terme en 1/r. On pallie cet ennui en choisissant pour T(0,t) la 
valeur obtenue à l'instant t — ôt au point adjacent (premier voisin), soit T(0,t) = T(0,t — ôt), 
ôt étant le pas dans le temps. 


9. Les transformées de Fourier 


9.1. Étude d'un vélocimètre 


Pour des particules se déplaçant selon l’axe du réseau à vitesse constante, le spectre en fréquence 
de la lumière transmise, appelée I(x), est le produit des transformées de Fourier de la fonction 
d’éclairement d’une part et de la fonction d'absorption d’autre part. 

Il s’agit donc dans un premier temps de calculer la transformée de Fourier d’un réseau de N 
trous alignés et équidistants. En choisissant l’origine au centre du réseau et en appelant F(k) la 
transformée de Fourier d’un trou, on aura : 

_ sin(rxa) 


I(x) TR (x)= F(x) X exp(2rjkxb) avec: F(x) pu 
N 


expression dans laquelle a est le diamètre du trou. Tout le calcul fait : 


ao) = XX . SOLE 


on retrouve l'expression classique des réseaux, et grosso modo, dans l’espace de Fourier, le terme 
[sin(rxbN)]/[sin(rxb)] élevé au carré donne un « spectre de raies » et le terme {sin(rxa)|/[r x] 
élevé au carré donne l’image de l'enveloppe de ces raies. Rappelons que x est un nombre d’ondes 
(inverse d’une longueur). 

En réalité, ce qui nous intéresse est le signal dépendant du temps t et de travailler dans 
l’espace de Fourier correspondant qui est celui des fréquences v. 

Dans notre problème, comme les longueurs sont parcourues à la vitesse constante v, il est 
commode d’effectuer la transformation sur le plan dimensionnel : [I] = vlt] et comme [X] = 
1/[ = 1/(v[t]) = [v]/v dans l’équation donnant &(X) il suffit donc de remplacer X par v/v, en 
désignant par V(r) la nouvelle fonction on obtient alors l'intensité de l’éclairement : 


sin(rxb) ? 


sin(nva/v) | sin(rvb/vN) z 


Y(v) = Io rv/v sin(nvb/v) 
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L'examen de cette expression permet de répondre aux questions : 


1. Le premier minimum nul de la modulation existe quand sin(rva/v) = 0, c’est-à-dire lorsque 
v = v/a. 

2. « Deux raies » consécutives sont séparées de la distance œ déterminée par deux maximums 
relatifs et consécutifs de la fonction « raie », elle est déterminée par la différence de deux 
valeurs consécutives qui annulent le dénominateur, on a donc : 


a = v/b. 


3. La finesse des raies, c’est-à-dire la largeur à mi-hauteur, est inversement proportionnelle à N, 
elle est donc de l’ordre de ca/N, et quand N est grand devant 1,c vaut 6. 


9.2. Calcul numérique des transformées de Fourier pour un nombre de données N = b° 


On envisage le cas où le nombre de données est une puissance de trois : N = 35. On écrit la 
définition de la TF : 


By = foWG + AWE + PWE + SW + 22 fu WOY 
puis on regroupe les termes en trois sommes partielles : 
De = foWN + BW + WA +... (= Ak) 
+ AW + FWN + HWN + (= BxWX) 
HIWA + SWN + RW + (= CW) 
d’où on tire : x = Åk + BW + CEWF. Ces expressions s’écrivent encore : 
Èr = foWNyjs + PWN + foWNis + 
+ LAW + PM gs + Waja t } WA 
+ {FWN + SSWA + SWN + WE 


On voit que Ák, Bk et Ck sont les transformées de Fourier de trois fois moins de points que 
n’en comporte l'échantillon initial. Cependant, les dernières relations ne peuvent être utilisées 
que pour k = 0,1,2,...,N/3 — 1, reste donc à régler les problèmes de périodicité : 


Pris = Ák LB + Cp W2E+N/3), 


équation qui se transforme de la manière suivante : 


1 v3 1 v3 
k+N/3 = Ák + BLWË (-; +$) +C, WF (-; à) ; 


un calcul analogue donne : 


1 v3 1 ,v3 
k+2N/3 = Áęk + B;WÈ (- à) + CRWÈF (-; +$) g 


La formule d’adressage des données s’écrit : 


j = Ry(k) = Ry(k — 37) + kin avec 31 < k < 3%tlet Ry (0) = 0. 


531 


MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ 


Dans le cas où M = bf, on combine linéairement b transformées de Fourier de b fois 
moins de points que dans l'échantillon initial. La première relation permet les calculs pour 
k = 0,1,2,..., N/b. Il reste à établir les b — 1 relations pour obtenir une transformée complète 
ce qui ne présente pas de difficulté. La formule d’adressage devient : 


j = RN(k) = Rank — b!) + Ba avec bI <k< btl et Rn (0) = 0. 


10. Introduction aux méthodes de Monte-Carlo 


Les exercices sont traités dans le cours p. 287 et suivantes. 


11. Éléments de calcul des probabilités 
11.1. L'ordre statistique 


à 
pe si TR <T CT avec k=1,2,3,...,n—1, 
SE si T<x, 
Sn = 1 si T>Tn. 


Sn prend des valeurs sur (0,1) et c’est une fonction non décroissante de x. C’est bien la 
fonction de répartition de la variable aléatoire x. 


b — P(£& < x) = F(x) expression qui est vraie pour tout £. Il s'ensuit que P(£x < x) = p pour 
toutes les composantes. 
c- 

P (Sala) = ZA = CAFE - FN" avec ot =. 

n á %7 o min-m)! 

Cette expression est donnée par la loi binomiale car toutes les composantes obéissent à la même 
distribution (répartition), elles sont toutes équiréparties (idem les faces d’un dé), et Sn (x) est 
la fréquence de succès ; toutes ces conditions sont celles du schéma de Bernoulli. 
d - Il suffit de placer x dans la série des at. Ainsi, P(x0 < x) est la probabilité pour qu’il y 
ait au moins j composantes de V inférieures à x. Cela revient au même de dire que S,(x) peut 


+1 Å : a j 
prendre les valeurs fi, El ,...,1? ou encore que $,(x) ne peut pas être inférieur à À 
n n 


Ici encore la probabilité d'obtenir la valeur i est donnée par la relation : 
P (st) = À) = CFE- Fe~, 
mais de plus, j prend les valeurs de j à n. Les événements étant indépendants : 


anla) = À P (Sala) = 2), 


m=j 


soit encore : 


onla) = D CHF" FC. 


m=j 
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e — On part de l'intégrale : 
F(x) 


i z 
ne J 70-077 8 
0 


que l’on va calculer par une succession d’intégrations par parties. Pour cela posons : 


du = ti~! dt 


(COFON — 
d; (x) 


d’où : 
t ; y ; ja 
u= F puis v = (1-H)? d'où dv= -(n — j)(1— t)" dt, 


on obtient alors : 


F(x) 
(n) z) = j ia n—j n!(n— j) j{4 _ s\n—-f—1 
aP (a) = CLP (PA — Fa} + TE J padt, 


on poursuit l'intégration par parties et l’on vérifie que l’on retrouve bien l'expression de Dax). 
En dérivant cette dernière fonction, on obtient la fonction de distribution recherchée : 
d à 
a) = À A E = SEE F(x)| 7. 
fla) = de) = gog OF) — FE) 


À partir de cette relation, il est facile de calculer la moyenne des {x} qui tombent dans « lurne 
j >, soit : 


— G-I) E j)! roren [1 — F(x)" z dz. 


f — Application — F(x) est la loi uniforme, soit : 
F(x) =zx pour x appartenant à (0,1) et vaut zéro ailleurs. 
f(x) =1 pour x appartenant à (0,1) et vaut zéro ailleurs. 


On utilise les dernières relations établies : 
1 


(CONS n! 5-11 li 
(z3 ) = E /* [1— x] dz. 


On remarque que les valeurs sont « symétriques » par rapport à la valeur centrale. 
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12. Lois 


12.1. L'exercice est sans difficulté 

12.2. L'exercice est traité dans le cours p. 320 
12.3. L'exercice est traité p. 328 et p. 331 
12.4. L'exercice est traité p. 336 

12.5. L'exercice n'offre pas de difficulté 


12.6. Loi de Poisson. Distribution de Cauchy 


+20 
a — On doit avoir Î 


—OO 


+00 
p(z) dz = ef exp(—aix|) dr = 1; 
soit encore : ar | exp —a|z| dz = 1. D'où k = a/2. 
0 
+00 
b — y(t) = I exp(j2rxt)p(x) dx expression dans laquelle t appartient à (—o0, +00). Soit 


se — 00 
1C1 : 


+00 oo 
p(t) = 5 I exp(j2rzt) exp(—a|z|) dx = 5 JeG2r20) +exp(—-j2rxt)] exp(—-ax) dx 
— CC 0 
a? 1 


a? + 4m2t2 Re 


c — Calcul de la moyenne : 


+00 


m=5 J sexpt-alel) de = 0 


— CO 


car la fonction sous le signe somme est impaire. Calcul de la variance : 


+00 co 
D= 5 J z? exp(—a|x|) dr = a fa exp(—az) dz. 
a 0 


On intègre deux fois par parties cette dernière expression, et l’on trouve : D = 2/a?. 


d — La distribution de Student à m degrés de liberté s’écrit : 


lm(£) 


—(m+1)/2 
_ T(m +1)/2 | a pour z € (—00; +00), 


7 VrmT(m/2) m 


où I(x) est la fonction factorielle. Dans le cas où m = 1, on obtient : 


(cette fonction s’appelle fonction de Lorentz). 
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e —- On a 


TF 1 
—2T|t +  ——— 
exp(—2r|#l) Ta 


expression donnée dans le cours à propos des transformées de Fourier. De là on écrit : ®(t) = 
exp(—2r|t|). 


f — Les variables aléatoires £; sont indépendantes et obéissent à la même fonction de distribution 


q(x); la variable aléatoire 2 obéit à une fonction de distribution q(x/n), ainsi, la variable 


n 
aléatoire z a sa fonction caractéristique Ÿ(t) égale au produit des fonctions caractéristiques 
p(t) de toutes les variables indépendantes £;/n. Nous avons donc : 


V5(t) = E(t/n) = exp(—2rlt/nl), 
ainsi: Y(t) = Į] [exp (-2rit/nl) = exp (—2r]t|). 


i=1 


La fonction de distribution de z est donc 


g — Calcul de la moyenne de é; : 


1F 

T 
M=- | Æ dr. 
Toa í 


C’est une fonction impaire, donc on pourrait dire que M = 0; cependant, M = [loge (1+2?) t%, 
la moyenne n’a pas de limite et n’existe donc pas au sens ordinaire. On dit que M = 0 en valeur 
principale au sens de Cauchy. 


12.7. Loi binomiale négative. Loi de Poisson dont le paramètre suit une loi du x?. 
Urne de Pélya 


1. a — La probabilité d’avoir tiré exactement k échecs qui précèdent le tirage du r° succès est 


f(k,r,p). 


b - Nous avons A = B - C, et comme les événements B et C sont indépendants, nous pouvons 
écrire : P(A) = P(B)P(C) avec : 


P(B) = (6 P" = Citk-1p" 7 D" = CAP p", 
et P(C) =p, 


d'où P(A)= CE ripp" = f(k,r,p) = (1) (e 
c — Transformons l'égalité pp" = p" (1 — g)" = 1, on trouve : p” P zo CE rag =1. 
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d — Par analogie avec la transformation réalisée sur la loi binomiale, on remplace q par qt pour 
obtenir la loi de génération des moments, soit : f(t) = p'(1— qt)”, que l’on développe encore : 


FO =p D Cker lat)” 


k=0 


expression à partir de laquelle on va calculer les deux premiers moments non centrés : 


OO 
= f'Q) = p'rgp = p" È Ckir-ika", 
k=0 


Q 


doù: my =r>. 
p 


On poursuit les calculs : 
F'O) = p"r(r Depp = p" X Chpriklk — 1)Qf = m — mu, 
k=0 


ce qui donne : 


M2 = Mı + r(r + nÉ, 
p? 
de là on tire l'écart type : 
2 2_ rq 
ol = Mo — MI = >. 
1 p? 


Pour mémoire, on rappelle que, pour la loi binomiale, on obtient le résultat : 


a? = npq. 
e — On écrit : p(t) = M[exp(jkt)], M( ) représentant l’opérateur moyenne, ce qui donne : 


plt) =p" X Ckir" exp(jkt) = p" X Ckerila expt)" = p'[1 — gexp(st)]" 
k=0 k=0 


2. a — On rappelle quelques résultats concernant la loi de Poisson : 
—A)AF 
pe = r) = PEN avec (£) =À et o? =À. 


b — Il convient de vérifier que f? g(x) dx = 1, pour cela calculons : 


[ee] [e9] 
QY 
I= v—l — 
[i exp(—a von Ei exp(—ax) dr, 
0 0 


effectuons le changement de variable y = ax, on obtient : 


Sfr 1 expl z) dz — Q . T(v) — 1, 
0 
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par ailleurs, l'expression sous le signe somme est toujours non négative, g(x) est donc bien une 
densité de probabilité. 


Calcul de 
D = feia Gi Put) dà, 
0 
soit : 


T(v+k) o” 


Î 4-1 expl(a + LA] dà = 


kT) ET) (a+ 
0 
soit encore : 
a” YV f Y a” V 
= la p Der kev- = (—1) (a+ D CË ps 


en définitive : 


expression dans laquelle on pose : p = 1/(a + 1) et q = a/(& + 1), ainsi on aboutit à : 
I(E = k) = p"Okpr10” 
qui est bien l'expression de la loi binomiale négative. 


3. a — Supposons que l’on ait tiré d’abord toutes les boules noires ensuite toutes les boules 
rouges, la probabilité de ce tirage s’écrirait dans ce cas particulier : 


b b+c b+ (nı — 1)c r r + (n2 — lc 
b+r b+r+ce b+r+(ni-1l)e b+r+mc  b+r+{(n1+n2-—1)c 


Maintenant, en examinant cette expression, on s’aperçoit que l’on peut réaliser n’importe 
quelle combinaison d’un des produits du numérateur et d’un des produits du numérateur sans 
que la probabilité soit changée ; et, si l’on considère un autre ordre pour les nı boules noires et 
n2 boules rouges, le calcul reste le même, mais les termes sont arrangés dans un autre ordre. 
Donc pourvu que n et nz ne soit pas changés, toutes les séquences où figurent nı boules noires 
et nz boules rouges ont la même probabilité quel que soit l’ordre de tirage des boules. 


Min = 


b — Par suite, la probabilité de tirer nı boules noires parmi n = nı + n2 boules est donc : 


n! n! b b+c 
P(n n) = CHI = —— Na pa a a N 
(nı ) n nin nilna! nina nilno! b +r b +r+c 
b+ (nı —1)c r r+ (no — lc 


b+r+(m-1le b+r+mc b+r+(nitn-1lle 


On divise chaque élément binôme du numérateur et chaque élément binôme du dénominateur 
de Ilh,n, par le nombre c, et l’on obtient : 


einer _ Cie re 
P(n,n) = Gr = ça : 
n+b/c+r/ce—i —b/c—r/c 
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c — Le changement de notation donne : 


EL OT 
Penn) = RE 


—1/7 


d — Lorsque n — œ et que p et y tendent vers zéro de telle sorte que : 
1 
np — À et ny — r 


ce qui entraîne aussi que nz > m1, c’est-à-dire que nz est de l’ordre de n; on peut étudier le 
comportement des différents facteurs : 


(D 


pr ? c2; 


—Àp! 


par ailleurs : 


1 ni 
=") = C2, +07" 


Ci © 5 Cin | yng 


ensuite on calcule l'expression suivante : 


CT an _ la+). la +y 1). 


Cin Ca (+7). [+n - 1)] 
Cette dernière expression est plus délicate à étudier et désignons par ax le terme général dans 


le dernier membre : 


a+yk o 2 
1+ yk 1+ yk 


âk = 


ce terme tend vers 1 quel que soit k par valeurs inférieures à 1. Prenons le logarithme de W, 
nous avons : 


n2 
Peer )= Des (1- n Dur Des. 
log.(W wap log.(1 + Ye E 
ge(W) P3 Zel 2) x p 


r À = àp, de là on tire : W =[:#-]°*, en définitive, on aboutit au résultat : 


pà ny 
p 1 
RS ota [rsl a | 


12.8. La loi binomiale négative (reprise et applications) 
Les questions a, b, c et d ont fait l’objet d’une réponse lors de l'étude du problème précédent. 


e — Voici les résultats du calcul : 
172 í 536 


=1,1 = — = 3,597, 2 = 2,282. 
mı = 150 5, puis M 149 3 et s 2,28 
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Tableau I.4. 

k expériences Pr* Pk (pe — Pk)? /Pr* 
0 70 0,467 0,318 0,475 x 107! 
1 38 0,253 0,364 0,487 x 107! 
2 17 0,133 0,209 0,434 x 1071 
3 10 0,067 0,080 0,252 x 107? 
4 9 0,060 0,023 0,228 x 107! 
5 3 0,020 0,005 0,45 x 107? 
6 2 0,013 0,001 0,111 x 107! 
7 1 0,006 0,000 1 0,6 x 1072 

8 et plus 0 0,0 0,0 0,0 


f — Bien que m et s? soient notablement différents, envisageons la distribution de Poisson en 
prenant À = mı, on obtient le tableau I.4. 

Pour la valeur expérimentale du x? ; on obtient 31, la consultation des tables du x? à (9 — 1) 
degrés de liberté (attention la case k = 0 compte...) montre que la probabilité de pouvoir 
dépasser ce nombre est inférieure à 1 chance sur 1000. Force nous est de rejeter l’hypothèse 
d’une distribution de Poisson avec moins d’une chance sur 1 000 de la rejeter à tort. 


g — Ona: p = m/o? = 0,502 4, par suite q = 0,4976 et r = 1,158. Réécrivons la loi binomiale 
négative : 


Le +} 
p'(-g)"=p D Chr gt = 1. 
k=0 


On calcule p” = 0,4507, il reste à calculer les différents coefficients du binôme que lon 
multiplie par p” (cf. Tab. 1.5). 


Tableau I.5. 
k expériences Pk* Pk 10° (pk* — Pk)? /Pr* 
0 70 0,467 0,4507 0,581 
1 38 0,253 0,2596 0,172 
2 17 0,133 0,139 4 0,308 
3 10 0,067 0,073 0,537 
4 9 0,060 0,037 8 8,066 
5 3 0,020 0,023 0,45 
6 2 0,013 0,014 0,008 
7 1 0,006 0,008 0,666 
8 et plus 0 0,0 0,0 0,0 
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En définitive, on trouve x? = 1,618 à (9 — 3) degrés de liberté (on a calculé p, q et r). Si Pon 
regarde les tables du x? on voit qu'il y a 95 chances sur 100 de dépasser la valeur calculée. Il 
n’y a pas de raison de ne pas conserver cette loi. 


12.9. Loi de Poisson. Durée de vie d'un système simple. Fiabilité 


a- 


1. À=0,5 P =0,5exp(—0,5) = 0,303 

2. À=2 P= 2exp(—2) = 0,271 

3. À=2 P =exp(—2) = 0,135 

4. À=2 P= 2exp(—2) = 0,271 puis P = 1- P)-— P, — P; = 0,323 
44 

5. à= Pi = — exp(—4) = 0,195. 


| 4! 


b — P(t) = [(At)*/k!lexp(—At). On écrit : F(t) = P(E < t), et la probabilité pour qu'il n’y 
ait aucun événement dans l'intervalle de temps t débutant à l'instant t; est Ph(t) = 1 — F(t) = 
exp(—àt), ce qui donne F(t) = 1 — exp(—At) et la densité de probabilité f(t) = Aexp(—At). 


Calcul de la moyenne 


OO 


a = fa exp(—t) dt, 
0 


après une intégration par parties on obtient : a = 1/À. 


Calcul de o? 


F 2 
D= J Paeon) dt = 5> 
0 


d’où 


D ns 
Une propriété remarquable — On écrit le théorème concernant le produit d'événements : P(A- 
B) = P(4): P(B|A), d’où la probabilité conditionnelle P(B|A) = P(A - B)/P(A) = ®(t). 
Comme P(A. B) = P(r<£<t+7)=F(t+7)-—F(r) et que par ailleurs : 

P(A)=P(É>T)=1-P(É<T)=1-F(r), 
on obtient en définitive : 

_ F(t+7r)-F(r) 
UD 

Enfin, remplaçons F(t) par sa valeur : ®(t) = 1 — exp(—At) = F(t). 
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12.10. Durée de vie d’un système. Loi de Weibull. Fiabilité 


a — Nous pouvons écrire : 


PC = PE) = 00 i aone TOEO: 


À présent ajoutons et retranchons no au numérateur de A(t) : 


| dF(t) 
AE) —non(t)+no-n(t+At) F(t)-F(t+At) da. 
Atn(t) ü Atn(t) n(t) 
no 


b — De ce résultat on déduit l'équation différentielle du premier ordre à laquelle obéit la 
répartition F(t) en fonction de A(t) : 


dF(t) 
dt 


c — L'intégration donne : log, [1 — F(t)} = je A(x) dz, d’où : 


+ X()f1 — F(t)] = 0. 


F(t) = 1 — exp - f xo) dx |. 
0 


d — À présent, A(t) = àoat® t}, il s'ensuit que : F(t) = 1 — exp (—Aof*), d’où la loi de Weibull : 
F(E) = Moat exp(— dot). 


e — Calcul de ā, nous avons : 
OO 
à — J tàoat™! exp(—àot%) dt, 
0 


après une intégration par parties on trouve : 


E 1 
a= r (14e). 
Q 


Calcul de D moment non centré du deuxième ordre, il s’effectue selon le même procédé : 


D= Je exp(—ot*) dt, 
0 


s -Sia 2 
D=” r(i+£). 


= 1 
a Q 


La densité de probabilité établie au § b du problème précédent est un cas particulier de la loi 
de Weibull dans laquelle il suffit de faire a = 1. 


on en déduit : 
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12.11. L'inégalité de Kolmogorov 


a — L’inégalité de Bienaymé-Tchebycheff est démontrée dans le cours. 


b — Partons de l'égalité : 


+20 
E(X’) = Î z?’ f(x) dz = J z? f(x) dx + Í z’ f(x) dX, 
2% Ixl<a Izl>a 


la première intégrale du second membre est majorée par a? J f(x) dz, d’où l'inégalité 
|z|<a 
demandée : 


E(X?) < @? Î f(x) dx + J r’ f(x) dr, 
Izl<a lrl>a 


expression dans laquelle a est compris entre 0 et B. 
Si |z| > a, il reste néanmoins que |z| < B. En désignant par F(x) la fonction de répartition 
de la variable aléatoire x, on obtient les relations suivantes : 


F(x)=1 sir>B 
F(x)=0 si x <-B, 


on peut écrire la suite d’inégalités : 
z? f(x) dr < B? T f(x) dz < B? J Fa 
a<|x|<B a<|z|<B Izl>a 


d’où il ressort que la dernière intégrale n’est rien d’autre que B?P(|X| > a). En remarquant 


que : f(x) dx < 1, on en conclut que : 
le|<a 
E(X?) < @ + B?P(|X|> a), 
soit encore : 


E(X?) - a 


P(|X| > a) > = 


12.12. Loi quasi normale 
a — On a E(Y) = 0 l'écart quadratique moyen E(Y?) = o?, E(Y°) = 0 et E(Y4) = 304. 


b - Ona: 


1 5 5 z? 
f(x) = pr + bz — 3a)“ exp (-5) ; 
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+00 
où f(x) est une fonction manifestement non négative, la condition f(x) dr = 1 impose la 


— 00 


relation : 6a? + b? = 1. Ensuite on calcule les différents moments : 


E(X) = 6ab — 6ab = 0 
E(X?) = 6a? + 3b? 
E(X?) = 12ab 
E(X#) = 24a? + 15b?. 


La condition E(X#) = 3E(X?} impose une autre relation : 
24a? + 15b? = 3 (6a? + 362)”, 
à laquelle nous combinons la condition de normalité 6a? + b? = 1 pour obtenir : 
36a — 14a? + 1 = 0, 
d’où nous tirons : 
a? =0,295 ouencore a? = 0,094. 
On peut choisir entre les deux valeurs de a?, car b? doit être positif, ce qui entraîne que 


a? < 1/6 = 0,166 donc a? = 0,094. 
Dans ces conditions, b? = 0,346 et o = 0,642. 


13. La fonction caractéristique 


13.1. (é=)" tend vers une gaussienne quand n croît positivement 


x 


a — La fonction caractéristique d’une variable gaussienne centrée réduite s'écrit : 


2 


+00 
1 
pt) = = J exp(j2ræt) exp (-5) dx = exp (—27°t?) 


c’est, bien sûr, une gaussienne. 

La variable ņ est la somme de deux variables gaussiennes, centrées, réduites et indépendantes, 
alors sa fonction caractéristique est Y(t) = y?(t) = exp(—4r?t?). y(t) est la transformée de 
Fourier de 1/(2,/x) exp (—t?/4) et l’on retrouve bien le théorème d’addition des variances : 
a? = 2 (cf. chapitre 21). 


b — À présent il suffit de faire une transformation linéaire x = (y — m)/o dans la fonction de 
distribution, on écrit : 


p(t) = 7 ET exp (HE) dy, 
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et l’on pose z = (y —m)/o ce qui donne y = aoz +m et dy = a dz. On obtient donc : 


p(t) = 'essbièr(ez + mjt] exp (-5) dz 


— CC 
( 9 ) +00 2 
exp(j2rtm Î . | ( z ) 
= —— exp(j2xozt) exp {| —— | dz, 
Tir p(j )exp | -5 
plt) = exp(j2rtm)p(ot) = exp(j2rtm) exp(—2r?0°t?), (1.7) 


théorème déjà établi dans le cours. 
La fonction caractéristique de la variable 7 qui est la somme de deux variables gaussiennes 
indépendantes est donc le produit des fonctions caractéristiques de chaque variable : 


Y(t) = expli2rt(m: + Mmo)lo(oit)w(oat) = explj2rt(m + ma) exp[—27°t° (0? + o3)] 


on voit qu’il suffit de poser m = mı + m2 et o? = o? + aż pour retrouver l'expression du 
théorème (1.7). Donc la distribution de n est : 


1 [y — M — mo]? i 
fa) = 27 (0? + o2) E ( 2(a? + 03) ) 


c — La généralisation n’est pas très difficile, on obtient : 
2 
1 [2 == Da Mg] 
F(z) = Ti 3 exp ( m 2 à 


d — Il s’agit de la fonction fente et la fonction caractéristique s'écrit : p(t) = [sin(rt)|/(rt). 
La fonction caractéristique de la variable £/n donne : y(t) = [sin(rt/n)|/(rt/n) (attention, il 
ne s’agit pas d’une dilatation d’abscisse….) et la fonction caractéristique de la variable aléatoire 


1 n 
7 = — > zk s'écrit : 
n 
k=1 


v) = ES K 


nt/n 
Développons 


: 242 242 
log.[Y(t)] = nlog, (EE) = n log, (i se ) S 


nt/n) 6n? 


autrement dit, Y(t) = Aexp |—t?/(20°)], ce qui veut dire que la densité de probabilité est 
gaussienne. Cela mérite un commentaire supplémentaire, en effet, on voit très bien que la 
valeur ø croît comme y/n, mais cela est conforme au théorème d’addition des o4 des variables 
indépendantes. Plus la somme des variables est élevée, plus ø croît. Il peut être alors utile 
d'effectuer un changement de variable pour conserver une échelle raisonnable. 

Il résulte de ces calculs que l’on connaît le comportement asymptotique de la fonction 
{sin(x)/x]" qui tend donc vers une gaussienne. Lorsque n est un ordre de grandeur plus grand que 
1, disons 10 environ, l'écart entre les deux fonctions en valeur absolue est de quelques millièmes. 
Ce théorème n'apparaît pas explicitement dans les ouvrages d’analyse. Le programme card0.c 
réalise les opérations proposées. 
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14. La loi du x? et la loi de Student 
14.1. Le test de Pearson 
a — On développe la fonction caractéristique de plusieurs variables : 
plti, t2,t3,.-- tm) = Mexp(j {t1X1 + t2X2 +t3X3,..., HimÂm})] 


en série de MacLaurin-Taylor, au préalable on s’intéresse au développement de : 
Kao Ae 
Xi k q 2 
exp(jt4Xą) i Ht Stea PE A 

puis au produit : 

m X2 

[| pt Xa) -I 142 Ti os EH pee RARE 

g=1 q=1 


et enfin à la fonction caractéristique : 


(tı, tz, t3, as stm) =M i ex X)| = ] + 3M[Xilt + jM[Xolto +. 


q=1 
| 1 1 1 
+ MX tm = MIX} — MIX — + — F MIXI, — 
Nous avons le développement direct de @(t1,t2,t3,..., tm) : 
ylti tz t moti aenta a ne SR ne 
1,02; Set 2 TA a y op n” 
pour {ta} = 0. 


Par identification, on obtient : 
8p 
FT MIX] pour {t4} =0. 


b - Si l’on spécifie l’ordre dans lequel les cas doivent se succéder : 
P(Yi = n, Y2 = n 3 = nr) = P1 0 pp, 


En revanche, si l’ordre n’a pas d'importance, il y a n! combinaisons de n éléments ; seulement, 
il doit y avoir nı éléments dans Jı, n2 éléments dans Iz, n, éléments dans I. Il y a donc nı! 
combinaisons dans J4 et np! combinaisons dans 1, lesquelles ont déjà été factorisées dans n! ; 
donc le coefficient qu’il convient d’appliquer au cas où l’ordre est spécifié est : 


n! 
nina! PE Nr! 
de là on tire la loi de distribution multinomiale : 


n! a 

Per — = = 1,72 n 

P(Y = m, Y = n2.. Yr =n) = — r IPI Pa Pre 
NIN: ... Np: 
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TE q D . . « . 
c — Nous avons Y, = } }-;Zęą = nombre de fois que Xk appartient à I4. La fonction 
caractéristique associée à cette variable s'écrit : 


Paltistasts,.. Sete) = M fev (Ez) ; 


k=1 


et comme P(Z? = 1) = px et comme P(Z? = 0) = 1 Son on peut écrire : 
k k 
T 
Paltasta, ta, -s tr) = Yo exp(jtr). 


La fonction caractéristique d’une somme de variables aléatoires indépendantes est le produit 
des fonctions caractéristiques de chacune des variables aléatoires, donc, ici, comme elles ont 
toutes la même fonction de distribution, on peut écrire : 


z n 
(tr, t2,l3,..., tr) = De 0) : 


k=1 


d — Il suffit de dériver la fonction caractéristique pour obtenir les moments désirés : 


n—1 
1 
Mig = = = 7" Pad exp(jta) De exp 6) pour {t4} = 0. 
4 k=1 


Comme 55, Pk = 1, on trouve : Mig = np, (ce résultat aurait pu être obtenu directement). 
Ensuite, par le même style de calculs, on montre que : 


d’où on déduit l’écart type : 
2 — 
o* = npq(1 — Pa). 
o est proportionnel à ./ñnp, donc U, est une variable centrée réduite indépendante de n. 


e — Écrivons la fonction caractéristique de U; : 


plats ...str) = ie D Uata )|- m [exo (Er E | 
“raté 


= exp (5 Env) £ Pa exp ( tl 


POZ Set] 


gel 
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Posons 


m r r 
, [p ._t 
a=ap(-33 tq a) et B= X B= > PTE 2 L 
q=1 1 q=1 q=1 v Pa 


puis développons chacune de ces quantités pour n tendant vers l'infini : 


ensuite : 


Revenons au produit AB : 


2 
1 r 5 P 
aB-1- 1 Ta- m) pa, 


reste à élever ce dernier résultat à la puissance n : 


n 


2 2 
P 1 r á 1 Tr ta 
AB = ji Da-{5evr) tej = exp -15-da 
q=1 q=1 


on en conclut que la variable U (vecteur) obéit à une loi gaussienne. 


r T Y, -np 1 T r 1 r 
U. SSN a Ne = — Yy -n| =0. 
Suvas ne Ein ALm ga n= 


Remarque importante — Les variables U, obéissent donc à une liaison linéaire. Cela ne signifie 
pas pour autant qu’elles ne sont pas indépendantes ; en effet, les probabilités sont théoriques 
car les variables obéissent à une loi de distribution théorique, et l'apparition d’une variable ne 
dépend aucunement de l’apparition de celles qui précèdent leur tirage. 


f — Chacune des composantes indépendantes U, tend donc vers la loi normale, alors la variable 
x? = DD U? est bien la somme des carrés de variables gaussiennes, centrées, réduites et 
indépendantes (à une constante multiplicative près). Comme la loi statistique théorique impose 
une contrainte c’est-à-dire que 5-1 UgyPq = 0 ou que 3-1 Yg = n, on perd un degré de 
liberté, il reste donc (r — 1) degrés de liberté. 


14.2. Le test de Student 
l'approche — L'inégalité de Bienaymé-Tchebycheff donne : 
1 
P(|(2) = m| > to) < 3, 
et l’on désire que cette probabilité soit égale à 0,1, ce qui donne t = Vi0. 
Par suite : [{x) — m| = sV10 = 11,54 cm 
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approche -— Nous avons : 


o= De (avec (1) = = Da 


i=1 


et par ailleurs : 


(zi — (x))? = (zi — m)? — m? + 2z; + (x)m? — 2x;(x), 


enfin : 
1 © 1 | 
Pad R D ne) 
1 n 
Remarque : On a aussi o? = =a Se — n(x)}°) et comme g? ne dépend pas de l’origine 
= 
i=1 


des x;, on peut aussi écrire : 


pese -D [e — m)? — nle) — m)?]. 


n 


i=1 


a — L'opération orthogonale s'effectue sur les vecteurs orthogonaux (x; — m). Il y a conservation 
du carré scalaire, soit : 


n n 
Xz; = Xle: — m)?. 
i=1 i=l 


b — La dernière équation de la transformation donne : 


d’où : 
(x) -m = . 
c — Comme 
= D [le — m)?  n((e)— m)? 


on obtient : 


d — Les variables (x; —m) sont normales, centrées, indépendantes et de même variance, il en est 
de même des variables z; obtenues par la transformation orthogonale qui conserve les longueurs 
et les angles. 
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e — On a: 


cette dernière expression est bien la définition d’une variable de Student à (n — 1) degrés de 
liberté (cf. le chapitre 22). Autrement dit, P[t < ta(n — 1)] = a ou encore : 


Plt>tafn—1)]=1- a. 


f — Puisque P(|t| > to) = 1 — a, cela entraîne : 


p(T > 4) =1-a, 


© 


soit encore : 


La condition 


o o 
-matt (Ftna) 
a la probabilité (1 — œ) de se réaliser. Attention aux valeurs absolues qui doublent l'intervalle ! 


g — On veut que |[{x) — m| appartienne à I avec 90 chances sur 100, donc : 


PC) -m| < 1) = P (12) = m| < tous = 1) LE) = 010. 


yn 
E 3,65 i ; 
Comme to,o5(19) = 1,729, on en déduit que I = DRI T = 1,4 (il s’agit de cm). 


approche — Si l’on admet que t obéit à une distribution gaussienne, nous avons : 
P(|t| < to) = a avec to = 1,645, il s'ensuit que 7’ = 1,645 x 3,65/V20 = 1,34 (cm). 

La morale de cette histoire tient en peu de mots : l'inégalité de Bienaymé-Tchebycheff convient 
pour toutes les lois de distribution c’est donc la plus pénalisante avec une erreur de 11,5 cm qui, 
il faut bien le dire, est peu significative ; le choix a priori d’une distribution gaussienne est très 
raisonnable puisque les données sont au nombre de 20, cependant, on va trouver une erreur un 
peu optimiste (1,34 cm) car le nombre de degrés de liberté n’est quand même pas très élevé ; le 
calcul rigoureux effectué avec la distribution de Student donne le bon résultat : une erreur de 
1,4 cm ce qui est peu au-dessus de l’erreur gaussienne. Sans avoir recours aux tables, on peut 
d'ores et déjà affirmer que la loi de Student tendant vers la loi de Gauss quand le nombre de 
degrés de liberté tend vers l'infini donnera le résultat : to,05(00) = 1,645. Au-delà d’un nombre 
de degrés de liberté de l’ordre de 50, la distribution gaussienne remplit bien son ‘office. 
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15. Systèmes à plusieurs variables aléatoires 


15.1. Système linéaire surdéterminé. Matrice de corrélation 


Voici les résultats : 


(x) =4 222,2 
(y) = 3,89 o? = 4,26 
(2) = 2,24 o2 = 0,75 
a — Calcul de 
1 n 
T zizi — (x) (2) 
i=1 
Trz Ja X 
OxOz 
1 n 
on trouve E X ziz = 9,06, d’où : 
i=1 
Tp = 0,078. 
b — Calcul de 
1 m 
m X ziyi — (x) (y) 
i=l 
"ey = OxOy i 
1 n 
on trouve x X ziyi = 15,4, d’où : 
i=1 
Ta = —0,052. 
c — Calcul de 
1 n 
Tyz = C:0y ; 
on tro + 10,17, d’où 
uve — ÿ ziyi = 10,17, d’où : 
n À iYi 
ra = 0,818. 
Étude des liaisons de corrélation : on teste l’hypothèse r = 0, et l’on calcule : 
As = IrzlVn -2 vn—2 = 0,22, 
Vl-r2, 
A — 2 
ae = CUNE e 
y mt 
Tyz|Vn — 2 
= = ___— | = 4,02. 


Qyy> = 
yz 
[1 — r2 
Re 
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Si aœ < ta(n — 2), on rejette alors l’hypothèse d’une liaison de corrélation avec la probabilité œ 
de la rejeter à tort. On a to,os(n — 2) = 1,86 donc on accepte l’hypothèse d’une absence d’une 
liaison de corrélation entre les variables x et z d’une part et x et z d’autre part. Seule la liaison 
entre les variables y et z est significative. En clair voici ce que signifie cette étude : 

1. il n’y a pas d'impôt perçu sur les personnes ; 

2. la taille d’une famille n’est pas liée à sa richesse ; 

3. les impôts perçus ne dépendent que de la quantité détenue. 


16. Critères de conformité 


16.1. Étalonnage d’un appareil de mesure 


a — Calcul de la moyenne : 


puis calcul de : 


d’où l’on tire : 


a 
12 
on remarque bien que a et b jouent des rôles identiques. 
b — On obtient le système : 
b+a=2m 
b — a = 02 V3 


sa résolution donne : a = m — a v3 et b = m + o v3. Numériquement, nous trouvons : 


m = 60,25 

D = 4079 

o? = 448,93 et o= 21,19 
a = 23,55 
b = 96,95. 


De là on tire la probabilité de tomber entre a et b : f(x) = 1/(b — a) = 0,013624 d’où le 
tableau I.6, page suivante, des probabilités théoriques. 

Nombre de degrés de liberté = 8 — 2 — 1 = 5, les trois contraintes étant le calcul de a et b 
ainsi que la normalisation de la distribution. 


Xas = D ED = 21,57 


où K est le nombre de cases de regroupement. 
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Tableau 1.6. 
23,55 30 40 50 60 70 80 90 96,95 
Mi 21 72 66 38 51 56 64 32 
mip} 35,15 54,5 54,5 54,5 54,5 54,5 54,5 37,87 


En consultant les tables, on trouve une probabilité inférieure à une chance sur mille de dépasser 
cette valeur, on ne prend pas beaucoup de risques en rejetant l'hypothèse d’une distribution 
uniforme. 


16.2. Tests d'’hypothèse 


a — Les résultats des calculs sont présentés dans tableau I.7. 


Tableau I.7. 
Mi intervalles P} P} cumulés var. c. r. (x) A(z) 
18 —2,815 0,002 4 
2 0,025 0,025 0,0145 
20 —2,185 0,0145 
3 0,0375 0,062 5 0,0456 
22 —1,154 0,060 1 
9 0,1125 0,175 0,118 
24 —0,923 0,1781 
12 0,15 0,325 0,208 5 
26 —0,292 0,386 6 
27 0,3375 0,6625 0,2501 
28 0,339 0,6367 
16 0,200 0,862 5 0,197 2 
30 0,970 0,8339 
7 0,0875 0,950 0,099 4 
32 1,601 0,9333 
2 0,025 0,975 0,0539 
34 2,232 0,987 2 
2 0,025 1,0 0,0128 
36 2,863 0,9979 


Notation - le terme « variable centrée réduite » a été abrégé en var. c. r. Par ailleurs, ®(x) 
désigne la fonction de répartition. Pour évaluer les moments, on a pris le milieu des intervalles 
de regroupement. 

On trouve alors : m = 26,92 m, puis D = 735 m? et enfin o = 3,17 m. 
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b — Les deux premières cases de regroupement ainsi que les deux dernières ne possèdent pas 
assez de représentants, donc on va regrouper les deux premières cases en une seule d’une part, 
et les deux dernières en une seule case d’autre part. 


c — Le tableau L.8 donne les résultats des calculs. 


Tableau I.8. 

m; intervalles P} Pi [Ap:|10% pž cumulés p; cumulés |A®]|10? 
18 

5 0,0625 0,0601 2,4 0,062 5 0,060 1 2 
22 

9 0,1125 0,118 5,5 0,175 0,1781 3 
24 

12 0,15 0,2085 58,5 0,325 0,386 6 62 
26 

27 0,337 5 0,250 1 87,4 0,6625 0,636 7 26 
28 

6 0,200 0,1972 2,8 0,8625 0,8339 28 
30 

7 0,087 5 0,099 4 11,9 0,95 0,933 3 17 
32 

4 0,050 0,066 7 16,7 1,0 1,0 0,0 
36 


K 
d - x}, = nJ (pi — p)? /p* = 4,24 où K est le nombre de cases de regroupement, K = 7. 
i=1 


e — Comme la loi normale impose deux contraintes auxquelles il faut ajouter la contrainte de 
normalisation, le nombre de degrés de liberté est donc K — 3 = 4. La consultation des tables du 
x? (4) donne, par interpolation linéaire, environ 37 chances sur 100 de pouvoir dépasser ce seuil. 
Il est clair que l’on conserve l’hypothèse d’une loi normale car les données ne contredisent pas 
cette hypothèse. 


f — Le test de Kolmogorov donne : v = sup|A®| = 0,062. Donc l = vyn = 0,555. La probabilité 
que l'écart maximal entre les deux répartitions soit non inférieur à 0,555 est 92 chances sur 100. 
Ce test ne comportant pas de degré de liberté est notablement plus optimiste que le critère 
du x?. 


17. Étude des dépendances dans le cas linéaire 


17.1. Test d'indépendance stochastique du tirage d’un échantillon 


Partie 1.a — La probabilité de tirer une sous-chaîne de longueur p est : P = (1/2)", le théorème 
de référence est celui des probabilités composées. 
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b -— Calcul de la moyenne 
Calcul de 


d’où o? = 2 et o = V2. 
c — Longueur moyenne des chaînes : Ag = Km = 2K. 


d — Soit P la probabilité que v; > Mo. Soit Q = 1— P la probabilité qu’il n’y ait aucune chaîne 
telle que v; > Mo. La probabilité p pour que v; > Mo est donnée par la relation : 


ZOO CRO 


en faisant usage du théorème des probabilités totales. La probabilité pour que v; soit inférieure 
à M est donc : q = 1 — p = 1 — (1/2)"0-1. Comme les K sous-chaînes sont indépendantes, la 
probabilité de ne pas réaliser au moins un événement est donc : Q = (1 — p)X, d’où il ressort 


que : 
1 Mo—11 À 
pi-o-i-u-nf-i-}i-() | 


Si K est assez grand ou encore si (1/2)M0—1 est assez petit devant l'unité, on peut écrire que : 


1 Mo—1 
P=K|- . 
(3) 
Application numérique — K = 10 et Mo = 8, on calcule alors : P = 0,078 par la formule 


approchée et P = 0,075 4 par la formule rigoureuse. 


e — Avec la formule approchée : P = 0,05 et Q = 0,95, et : 


1\ Mo-1 K 
0,95 < i — G) | 


ce qui entraîne que K(1/2)M0-1 < 0,05, et comme K = n/2, on obtient : 
log.(20n) 
log. (2) 


11 Mo-1 
loge (0,95) > K log, i — (3) | . 


À partir de maintenant, pour obtenir Mo il faut réaliser des approximations qui vont conduire 
au même résultat que celui précédemment obtenu. 


Mo < 


Avec la formule rigoureuse : 
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Application numérique — n = 100. On trouve alors Mo < 11. Avec l'expression donnée dans le 
cours on a Mo = 10. 


Partie 2. a — Comme K est grand devant l’unité et que Ag = Km = 2K, on en déduit que 
Àx est grand devant l'unité. 

Nous avons : £ = ne l; les l; étant indépendants, X? = Ko? = 2K d’où : E = V2K. Le 
théorème central limite nous dit que la distribution de £ est gaussienne ; à partir de là on peut 
écrire la distribution de £ : 


1 (x — _ 
z) = ex ; 
AST | 25? 
d’où l’on déduit que : 
Vo — ÀK 
vo >, 
_ _1 (z - àx} 1 e 
ren folles | la) 


puis encore : 


1 ? 
P(E > vo) = 0,05 = —— exp | —— } dx, 
Vo — 2K min 


V 2K min 
d’où il ressort : 


Vo — 2K min 


> 1,65. 
2K am 


La résolution de l'équation du second degré donne une seule racine positive : 


(1,65 + 2,723 F 4%)” 


Krmin Fa 8 ; 


par conséquent on doit avoir K > Kin- 


Application numérique — n = 100. On trouve alors Kmin = 42. L'expression donnée dans le 
cours fournit le nombre 41. Soit d la différence numérique entre les deux tests : 


2 2 2 8 


1 1 1 2 
zn+z -vn l-z {-a+ arany, 
avec à = 1,65 en effectuant les développements usuels : | 


a 1 2 1 1 a n : 
= Lu /ne fe =, fe Ssa pe L = 
d n+ zV” sd a+2yn} Fo zV” R } 
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b — Chacun des deux tests a fait l’objet d’un calcul concernant l’exploitation d’une certaine 
distribution. Si les deux tests sont utilisés ensemble, il faut alors calculer la probabilité 
conditionnelle de la réalisation du second test sachant que le premier s’est réalisé. Les choses 
peuvent être corrigées dans le sens suivant : on sait, à présent, que toutes les chaînes ont une 
longueur inférieure à Mo. Approximativement, la moyenne est donnée par l'expression : 


Mo-1 


1\° M 
0 | m2 210, 
m = > (3) x2 zm 


Pour Mo > 16, l'erreur est de l’ordre de 51074 par rapport à la solution asymptotique. Par 
ailleurs, on calcule le moment du second ordre : 


AM-3M2 Mè 


A 
D =2+ 2Mo-1 22Mo—2 ` 


À partir de là, on retrouve le théorème central limite, et l’on peut effectuer les développements 
traditionnels. 


17.2. Loi F(m, I). Étude du rapport de deux variances : loi de Fisher-Snedecor 


1. — Distribution de e = 1/(m — 1) 327, £2, chaque £? indépendant obéit à la distribution : 


( ) 1 z? 
T ex 
Po x p 202 J? 


chaque £? obéit à la distribution : 


si y > 0 et p(y) = 0 si y < 0. Calculons la fonction caractéristique de £? : 


+0 


1 - 1 Vi dz 
20 = Jaz | Peet) de= J Zala 
+20 
-L f epla) dr = r0) (1-25 2 


y an(1—2jt) J /7(1 — 2jt) 


Il s'ensuit que la fonction caractéristique de la variable aléatoire (m — 1)£? s'écrit : 
(t) = (1 — 2jt) 7/2 pour t € (—00, +00). 


Pour obtenir la fonction de distribution, il n’est pas utile de calculer la transformée de Fourier 
inverse, pour cela il suffit de remarquer que : 


+00 


A f 20/21 exp (-5) exp(jtr) de = (1 — 24t) "2, 
0 
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A étant un coefficient de normalisation. Donc la densité de probabilité de la variable aléatoire 
(m — 1)é? s'écrit : 

p(x) = Ax™/2-1 exp (-5) pour x € (0,+co), 
avec 


1 
A =’ >» 
2m/2T (m/2) 


d’où l'expression : 


1 % 
1 mn a, 
pla) = EG © exp ( 5) 


Nous avons donc : 


1 m z TF ne 
—— ~ r eS > m/2 
TENTE) exp ( =) —> (1-2jt) ; 


La fonction caractéristique #(t) de la variable aléatoire £? s'exprime en fonction de celle de 
(m — 1)£?, c'est-à-dire : 


wa = 8 ( f )= (G-a DE Dot A E 


m-1 


Il suffit d'appliquer le théorème de dilatation d’abscisse sur les transformées de Fourier pour 
obtenir la densité de probabilité p(z) de la variable £? : 


fa) 5E p4) 


ae N 


lal 


avec a = (m — 1), ce qui donne : 


— 17/2 = 
pe(z,m) = Tgi e (- (m : de) l 


2. a — La loi de distribution de 7 est immédiate : 


— 17/2 _ 
(n —1) Z(n/2)-1 exp (- (n 22) ; 


Palem) = RAT 2 


b - La distribution de w = u/v qui est le rapport de deux variables positives et indépendantes 
u et v de distribution p,(u) et p.(v) est donnée par l'expression établie en cours : 


p(z) = J Pulzz)pz(£)z dz. 


HOSP Jee Sp (5) g/d- exp (5) ET 
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avec 


B= (n— 1j . (m - 1)7/2 J{m/2)-1 
20/27 (n/2) 2/27 (m/2) 


En poursuivant les calculs : 
OO 
Paz) = pBatr/2-1 ES exp (- (m 7”) zt/2-1 exp (- (n 7) “a 
0 


= Bart | gm/2+(n/2)- l'exp {- zin —1+(m-—1)z] } dx, 


alors, en posant r = (x/2)[n — 1 + (m — 1)z], on obtient 


2r t d 2dr 
= & — 
n—1l+{(m—1)z : n—l+(m-1)z 
puis : 
pS m/2+(n/2)—1 2d 
= Bz™/2)-1 L 
PURE J E N —1+(m- | exp( de 1+(m—1)z 

0 


(m+n) (m+n) 
= BAD 1 (n -1)+(m—-1)] 2 (2) 2 fr 2  exp(-r) dr 
0 


soit encore : 
m+n) 
pee) = B-n 14 (m-pa E ger (TER), 


Réécrivons tous les termes : 


CR RC) 


Nous allons encore nous livrer à quelques petites manœuvres en posant y = (m — 1)/(n—1)z, 
mais attention aux changements de variables dans les lois de distribution car 
dy/ dz = (m —1)/(n — 1), en définitive, on trouve : 


_ (n— 1)/2(m = 1m/2 n —1\ 0/2- 
p(y) = TD mA G=) 


HIRS (m+n) (m+n) m+n n—1 
T E G EE 


soit encore : 


mtn m m+n 
p-(4) = ma EE + pa ; 
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d — Calculons la moyenne de y que l’on note (y) : 


(z242) F m (m+n) m n m 
271l 2 = — — — mme 
Qu) = el bn fuit Cu y dy Le sh 2 1) n—2 
0 
e — Calcul de 
(re) oo a (m+n) m n m{m + 2) 
2 2 y? du = ns D he Ne 
(= mig le Jr 0+9) + p dy=B(3 +2372) mand). 


d’où l’on tire 


> 2m(m+n—2) 
DD UE, 
(n —2)?(n — 4) 
f — Le nombre de degrés de liberté : chaque variable a m et n degrés de liberté et il faut 
dénombrer les contraintes; il y en a une par variable pour le calcul de o?. Donc la loi est à 
(m — 1,n — 1) degrés de liberté. 


g — Montrons que Fi-alm,n) = (attention m et n ne jouent pas des rôles symé- 


1 
Fa(n,m) 
triques) : 


Bm; oo 
z5 r (242) a mi 2 ren) = r (745) y? _ (mn) 
= T{n/2)T (m2) Í eE er E Tao (+a) dy, 


max 


après avoir abandonné le coefficient devant le signe somme qui n’est d'aucun intérêt ; effectuons 
1 ? 


un changement de variable dans la seconde intégrale à savoir y = —, on trouve : 
T 


F m (m+n Sax mi m+n) 
œa = f a 2 dy= I x? (1+zx) 2 dg, 
Bmax 


BminBmax = 1, ou encore : 1/ Bmax = Fa(n, m) mais par ailleurs : 
Brin + Fa (m, n) et Bmax = Fi-a(m, n) 


et par conséquent : 
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18. Analyse de régression-corrélation 


18.1. La distribution gaussienne à deux dimensions. Coefficient de corrélation 


n -nm -m 
a — On a évidemment : x = som: et y = A 
Ox Oy 


b — On doit avoir 


-+00 +00 2 2 2 
[[ tenava ff e cs SH) de ds 


pour calculer cette intégrale, on effectue un changement de variables : 


Bs=x-ay et Br —yvl-a?, 
qui conduit au jacobien : 


lzy P 
O(s,r) Vi-œ 


Ainsi, on obtient : 


+00 
2 
l= aff exp( =?) expl) dr ds = A A = “ps al 
—00 


c — La fonction de répartition s'écrit simplement : 


P(x,y) = j J otan) du dv 


—00 — 00 


où 


expression à partir de laquelle on tire : 


P(x) = [aus du = À le ET — 20y)? exp ET — a?) dy 


d — Pour que Y,(x) soit la loi normale réduite, il faut que 8? = 2(1 — a). Comme x et y 
jouent des rôles symétriques, forcément, y obéit à la loi normale réduite si x obéit à la loi 
normale réduite. 
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e — Calcul de la covariance : 


z? — 2axy + y? 


+00 
1 1 
Kz = — — — mM A 
Y= z = »%( 21 — ©) ) de du 


et on effectue un changement de variable identique à celui du § b seulement 8 est remplacé par 
sa valeur du $ d. On établit que : Kzy = à, c'est la covariance de x et y mais aussi le coefficient 
de corrélation car les variables sont centrées et réduites ce qui impose que les écarts quadratiques 
sont égaux à 1. 

Dans le cas où œ = 0, Y{x,y) = V;(æ)V,(y) et dans le cas de la loi normale, l’absence 
de corrélation entraîne l'indépendance des variables ce qui était affirmé en cours, mais non 
démontré. 


f — D'expression de la droite de régression de y en x s'écrit : y = œz car il s’agit de variables 
centrées. 


g — L’équation caractéristique associée aux variables x et y est la transformée de Fourier à 
deux dimensions de la fonction de distribution y(u, v) c’est-à-dire : 


+00 

2 2 

z” — 2ary +y ; 

x(u, v) = l exp (r) exp[2rj(xu + yv)] dz dy, 
— 0 

et pour effectuer l'intégration, on effectue les changements de variables suivants : 


x — ay y 
TVT = et svT = +, 
p v2 
soit: x = Bryr + asv 2r 

y = SV 2T, 


transformations qui conduisent au jacobien (compte tenu du fait que 8? = 2(1 — a@?)) : 


J= ED or ie 


d(r,s 
Ainsi, on obtient : 
F +00 
x(u,v) = A* I exp(—rr?°) exp[2rj(ußry/r)] dr f exp(—rs?) exp|2rj(au + v)sV2r)] ds. 


enfin : 


x(u, v) = exp|—2r? (u? + 2auv + v?)]. 


18.2. Étude d'un changement de phase. Analyse de régression 
a — L'équation de la droite de régression S1 : Yi (x) = à1 + b1 (z — Z1) où : 

Ni 
1 päi X tipi — Nıžığı 
T1 = — i i = a : b rmi he 
zı N, B z CA N, + Yi 1 Mo, 
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avec 
M 
1 
D ie AND 
On — N > (zi T1) 
i=1 


Par ailleurs on connaît zo, donc on calcule Yı (zo) = Āā, + b1(to — #1); ensuite, on en déduit 
l'intervalle de confiance sur cette valeur estimée : 


(zo — 1)? 


S 
AY (zo <t Nı — 2—1 + ——— 
[AY1(xo)| < tay2(Ni — 2) IN: = 


avec 
E: 
S? carre D > 7 
y; Lu- Mi) 
ici, comme d’habitude, t,/2(N1 — 2) est la distribution de Student à (N; — 2) degrés de liberté 
avec le niveau de confiance (1 — aœ). Attention aux valeurs absolues. 


b — Nous avons le même résultat pour la droite S2 : Y2(x) = ào + b2(x — &2) pour cela, il suffit 
de remplacer l'indice 1 par l'indice 2. En définitive, on obtient : 


IAH] = |AY:(xo) + AY; (z0). 


18.3. Mesure d'une température par spectroscopie 


a — Posons Zj = log, [13/(2J + 1)] ainsi : Zz = A — B[J(J + 1)/T]. La pente de la droite de 


régression est donc 8 = —B/T et par ailleurs elle est donnée par le calcul statistique : 
n 
XO Xi:Zi-nťZ 
i=1 P 
= ~, avec X= ilil 
B noz , Vi i i( ) 


et 
2 1 Z v\2 
vx =) (Xi-X) š 
i=1 


b - On a T = -B/B dont on déduit : |AT| = AA = Br lAË] avec : 


ABl = tantn 2 
où 
1 n 
s? E De —_Y(x)f. 
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18.4. Solubilité du nitrate de sodium dans l'eau 
a — On écrit l'équation de la droite de régression : Y (x) = à + b(x — x) où : 


Oz y 


T étant le coefficient de corrélation. On trouve les résultats numériques suivants : 
1 n 
3=26, ā=9=90,14, 021,24, oy=18,51 et = Ņ ziyi = 2736,5 
i=l 


ensuite on calcule : b = 0,871, F = 0,999. Il n’y a aucune raison de rejeter une liaison de 
corrélation puisqu'il y a quasiment une dépendance linéaire. La droite de régression s'écrit 
donc : Y (x) = 90,14 + 0,871(x — 26) = 67,5 + 0,871x. 

Calculons à présent S? = -+ Yine: — Y(x:)]? = 0,805 d’où S = 0,805. 


b — Pour zọ = 40, voici les résultats trouvés : y = 102,34 avec une incertitude : 


Ean 
vn o? 


Autrement dit, on a 90 chances sur 100 de tomber dans l'intervalle |Ay]. 


y2 
[Ay] = +tayo(7) lom a = +0,68 avec a = 0,10. 


19. Les fractions continues 


19.1. Calcul d'une fonction donnée sous forme d'une fraction continue 
a — D’abord on calcule : P,/Qı = Ao, puis P2/Q2 = [Ao A1 + (x — ao)|/4ı, et enfin : 
P; A (x E ao) A2 N AoA A2 + Ao(x = a1) + A(x — ao) | 


= 0 À —— 
Q3 AA + (x = a) AÁ + (x — a) 

À partir de cette dernière expression, la démonstration des relations cherchées s'effectue par 
récurrence ; les relations sont donc vraies pour m = 3, montrons qu’elles sont vraies pour m +1. 
Il suffit de remplacer Am-—ı par Am-1 + (£ — am-_1)/Am, dans les relations : 

«e Em = Am-1Pm-1 + (x am-2)Pm-2 
Qm TE Am-1Qm-1 F (x a Gm-2)Qm-2 
mais il est commode de former le rapport Pm+1/Qm+1 : 
Pn+1 ES AÅm-1Åm + (x T am-1)Pm—1 + (z z Gm-2) Pm-24m 


Qm+1 Am-1Åm F (x = Am—1)Qm1 ae (x = am-2)Qm-2Åm 
en Am lAm-1Pm-1 + (z Er Gm-2)Pm-2] + (x = am-1)Pm-1 
Am[Am-1Qm-1 + (x ai am-2)Qm-2] D (x m am-1})Qm-1 
= An Pm + (£ — am-1)Pm-1 f 


E AmQm + (x = am-1)Qm-1 
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b — Nous avons : f(x) = f(xo) + [(x — xo)/1!]f'(xo) au premier ordre donc : 


Ao = f(z) et A= IEN . 

c — Utilisons la relation (que l’on ne demande pas de démontrer) : 

Akı = Ge Dé ; 

(k — 1) + Ak-1 -ian 
on calcule : 
2 f" 
A = a = E 
puis : 
3f”? c2 


A = = f 
3 _3f'f"? + afp Ci [2 Zi C1c3] 


d — Étude de la fonction y = log, (1 + x). On écrit : df/ dz = 1/(1 + zo), puis : 
df 1 d3f 2 


= t en 
dz? (1 + zo}? dz? (1+ zo)?’ 


et d’une façon générale : 
d’'f_ (n-1)! 
dz” = (1 + zo)” 
Ensuite, on calcule : Ao = log, (1 + zo), A1 = (1 + z0), A2 = 2, A3 = 3(1 + zo). 


Pour calculer log, (x), il suffit de faire xo = 0. Les relations de récurrence donnent : 
Po = 1, Qo = 0, P, = Ao et Qı = 1. En définitive, on obtient : 


x(9 + x) 
log. (1 x e, 
ERS rar 
et pour g = 1, on trouve log, (2) & 0,769. 
r? go rt 
e — Le développement de log,(1 +£) = x A + s (au même ordre que pour la question 


précédente) donne log, (2) ~ 0,583. 
L'erreur absolue sur le résultat donné par la formule de MacLaurin est 0,2 tandis qu’elle est 
de 0,08 sur le résultat donné par la fraction continue. 


20. Éléments de traitement du signal 

20.1. Détermination d'une constante de temps 
1 

a — On a V(t) = Aexp(—at) avec a = RE 

Approche n° 1 — On note les données (V;,t;) pour à = 0,1,2,..., N. On prend le logarithme 

de l'expression précédente, ce qui permet de linéariser le problème : 


log, (V:) = ĉi = log, (A) ae ati = à — at, 
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a et a sont les inconnues du système linéarisé. œ est donc déterminé par la pente de la droite 
de régression de £ en t, à savoir : 


N 
(N +1) - X Et: 
i=0 
(N +1}s? í 


Œ& — 


où £ et t sont respectivement la moyenne des £ et des t, et s2 est l'écart quadratique moyen 
des t. On trouve : 


N 
E= 3,050, F=5 et Ÿ it: = 133,35 et enfin s? = 10,0, 
i=0 


on trouve que œ = —0,3126 et que z = s/(s:VN + I) avec s? = (1/N)lé; — Y(t:)]?, puis 
on obtient : s = 0,010 42 et z = 0,01405. Enfin, pour terminer, on trouve dans les tables de 
Student : t015(9) = 1,156 après avoir effectué une interpolation linéaire. De là on déduit la 
valeur numérique de ĝa = 2t015(9) = +0,016 2. Autrement dit, nous avons 70 chances sur 100 
de trouver a dans l'intervalle : 


0,328 84 < aœ < —0,296 44. 


Approche n° 2 — Nous avons V = À + B exp(8t) et il nous faut calculer À, B et 8. On sait 
que les abscisses { sont en progression arithmétique de raison At et de premier terme to, ainsi, 
les équations discrétisées s’écrivent : 


V; = A + Bexp(6t;) = A + B exp[B(to + iAt)] 
en posant u = exp(BAt) et p; = A + B expl8(to + iAt)] on obtient les équations : 


Vi = A+ Bp: 
Vi+ı = A + Bpiu 
Vi2 = A + Bpiv° 
Vis = A+ Bpiu’ etc. 


À présent, on note A; les différences premières de V; à savoir : 
À; = Ab; = br — b; pour t= 0l 2em d, 
ce qui nous permet d’écrire : 


A; = Bpi(u — 1) 
Air = Bp;(u = lju 
équations entre lesquelles on élimine Bp; ce qui donne : uA; = A;41, on a (n — 2) équations de 


ce type où 1 prend les valeurs 0,1,2,...,n — 2. À présent, on détermine u par la méthode des 
moindres carrés en posant €; = uA; — À;,1, et l’on minimise la somme des carrés des résidus : 


n—2 n—2 
E? = Je = So [uA; — Apal ; 
=p i—0 
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en la dérivant par rapport à u, soit : 


ce qui donne : 


Comme u = exp(BAt), on tire immédiatement : 8 = À log, (u). À présent, on obtient A et B 
en écrivant n + 1 équations (incompatibles) : V; = À + Bp; auxquelles on applique la méthode 
des moindres carrés. On pose : 


e€; = À + Bpi — V; 


et E° = 35e? = A+ Bp, vi 
i=0 


On minimise cette dernière expression par rapport à À et B ce qui nous donne un système 
linéaire de deux équations à deux inconnues (cf. la droite de régression), on obtient en définitive : 


n Nn n n 
DE -2 Vin 9 P: 


À 
(n+1) DE Na 
i=0 i=0 
a+ DE Ve- SUD 
B= 


(n+1) DE DOD 
i=0 i=0 
Application numérique — On trouve : b = —0,3042 puis À = —0,7564 et B = 101,5. 
Le module de la différence entre a et 8, noté da, est 0,008 4. La valeur correspondante de 
ta/2(9) s'obtient à partir des calculs de la première partie : 


— = 0,6. 
t2(9) = À = 0,6 


La consultation de la table de Student donne environ y/2 = 0,25, soit de l’ordre de 50 chances 
sur 100 de tomber dans l'intervalle ĝa. On notera que cet intervalle est environ deux fois plus 
petit que le précédent calculé dans la première partie pour lequel correspondait une probabilité 
de 70 chances sur 100, c'est donc tout à fait normal de trouver une probabilité plus faible (50 
chances sur 100) de tomber dans ĝa. 
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développement asymptotique : 40, 43, 447, 
475 
combinaison linéaire de : 46 
de cerf : 47 
de erf : 47 
de l’exponentielle intégrale : 47 
des fonctions de Bessel : 48 
des intégrales de Fresnel : 48 
différenciation d’un : 46 
du cosinus intégral : 47 
du sinus intégral : 47 
intégration d’un : 46 
produit de : 46 
rapport de : 47 
développement en série : 39, 422 
de Fourier : 36, 234, 236-238, 240, 243, 246 
de polynômes : 120 
dichotomie : 52, 53 
différences 
divisées : 397 
premières, deuxièmes etc. : 95, 96, 397 
différenciations rétrogrades (méthode des) : 
207, 208, 213 
digamma (fonction) : 430 
Dirac 
fonction de : 438, 441 
impulsion de : 439, 441 
peigne de ou fonction sha : 438 
Dirichlet (conditions de) : 216 
dissymétrie : 319 
distribution 
binomiale négative : 477 
d’une somme de deux variables aléatoires 
indépendantes : 327, 339 
de Poisson : 313, 477 
de Student : 336, 339 
du y? : 328, 333 
exponentielle : 295 
gaussienne : 331, 470, 486, 491 
normale : 340 
rapport de deux variables aléatoires 
indépendantes : 490 
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rapport de deux variances 
(Fisher-Snedecor) : 490 
rectangulaire : 470, 481 
division d’un polynôme par un binôme : 445 
droite de régression : 376, 377 


Écart 
probable : 320 
type : 307, 308 
échantillon : 352-354, 358 
échantillonnage : 260-262, 267-269, 271, 469, 
482, 488 
théorème d’ : 263 
échelon unité : 269 
énergie d’un signal : 433 
epsilon-algorithme : 38, 39 
matriciel : 37, 38 
scalaire : 35, 38, 39 
vectoriel : 37-39, 41 
équation 
algébrique : 51 
aux dérivées partielles : 215-217 
caractéristique : 67, 68, 79, 84, 86, 216 
de convolution (résolution) : 249, 273, 274, 
283, 284, 439 
de Fredholm : 39, 42, 274, 280, 282, 439 
de la chaleur : 216, 225, 229, 467 
de Laplace : 216, 221 
de Mathieu : 462 
de Poisson : 216, 220, 221 
de type 
elliptique : 216, 220 
hyperbolique : 216, 225 
parabolique : 216, 224 
de Van der Pol : 462 
des cordes vibrantes : 216 
différentielle : 195-198, 200, 207, 210, 214 
du pendule : 195, 214 
intégrale : 39, 273-275, 280 
de Fredholm de deuxième espèce : 39, 41 
de Fredholm de première espèce : 274, 
280, 282 
intégro-différentielle : 281 
séculaire : 79 
transcendante : 51 
équipotentielles d’une triode : 222, 223 
erf (fonction erreur) : 47 
erreur(s) 
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calcul d’ : 24 
d’arrondi : 21, 30, 58, 129, 139 
de troncature : 23, 25, 26 
fonction : 47, 505 
erreur complémentaire : 47, 447 
minimisation de : 89, 93, 94 
espace des phases : 462 
espérance mathématique : 307 
estimateur : 
371, 376 


26, 291, 357, 359, 361, 363. 364, 


filtre : 244-246, 440, 441 
Fisher-Snedecor (loi de) : 489, 490 
fonction(s) 


estimation : 18, 22, 26, 357-359, 369, 375, 378 


étalonnage d’un appareil : 486 
Euler 
constante d’ : 43, 145, 177, 183, 430, 444 
fonction 
de deuxième espèce : 331 
de première espèce : 338 
méthode de : 464 
Euler-MacLaurin 
formule de la somme : 180, 184 
méthode d'intégration d’ : 177 
événements 
compatibles : 302 
contraires : 302, 303 
dépendants : 303 
équiprobables : 300 
incompatibles : 300, 302-305 
indépendants : 302, 303 
produit de deux : 301, 303 
somme de deux : 301, 303 
exponentielle 
calcul de la fonction : 421 
intégrale (fonction) : 47 
exposant : 27-30 
extraction d’un signal noyé dans du bruit : 
437 
extrapolation de Richardson (procédé d’) : 
31-35 


F.F.T. : 249, 251-255, 257, 260, 262, 263, 
266, 271, 467, 531 
à deux dimensions : 271, 272 
factorielle (fonction) : 432 
fenêtre (fonction) : 231, 245, 246 
Ferrari : 19 
fiabilité : 311, 314, 478, 479 
Fibonacci : 443 
filtrage : 229, 244, 246, 440 


aléatoire : 435 
caractéristique : 325-328 
cosinus intégral : 43 
d'appareil : 283, 439 
d’autocorrélation : 435-437, 441 
d'Heaviside : 269 
d’intercorrélation : 437, 438 
de Bessel : 429, 430, 432 
de corrélation : 435 
de Dirac : 438, 441 
de Weber-Hermite (ou du cylindre 
parabolique) : 157, 162 

digamma : 430 
du cylindre parabolique : 90, 157, 162, 260 
erreur : 505 
erreur complémentaire : 447 
eulérienne 

de deuxième espèce : 331 

de première espèce : 338 
exponentielle intégrale : 47 
factorielle : 432 
fenêtre : 231, 245, 246 
gamma : 328, 430, 431 
génératrice des moments : 312 
génératrice des polynômes 

d’Hermite : 162 

de Bernoulli : 177 

de Laguerre : 149 

de Legendre : 120 

de Tchebycheff : 139 
lipschitzienne : 196, 210 
orthogonales : 113, 390 
peigne : 438 
répartition : 305-307 
sinus intégral : 47 
spline : 101, 102, 105 
unité : 269 
& de Riemann : 444, 445 


fonctionnelle régularisante : 276, 285 
formule 
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de Bayes : 304 

de la somme (Euler-MacLaurin) : 177, 180, 
184 

de Lagrange : 190 

de Moivre : 236 


de Poisson : 271 

de Rodriguëès : 115-117, 141, 157, 189 

de Stirling : 316 

des probabilités totales : 304 

des trapèzes : 182 

des trois niveaux : 188 

du binôme : 312 
Fourier 

coefficient de : 235, 237, 243, 245, 246 

développement en série de : 234, 236-238, 

240, 243, 246 

équation de la chaleur : 225, 229 

intégrales de : 250, 252, 253 

série de : 229, 232-235, 238, 241, 244, 246 

transformée de : 237, 241, 242, 246, 249, 

251-255, 257, 260, 262, 263, 266, 271 

fractions 

continues : 397, 398, 400-403 

rationnelles : 397, 398, 407-411, 413 
Fredholm 

équation de : 39, 42, 274, 280, 282, 439 

deuxième espèce : 41 
première espèce : 274, 280, 282 

fréquences de diverses gammes : 444 
Fresnel (intégrale de) : 48 
Frobenius (forme canonique de) : 84, 85 


Gamma 
constante d’Euler : 430, 444 
fonction : 328, 430, 431 
gamme 
naturelle : 444 
tempérée : 444 
Gauss 
-Laplace (loi de) : 311, 312, 316, 317 
méthode 
d'intégration de Gauss-Hermite : 153, 161 
d'intégration de Gauss-Laguerre : 141, 
147, 150 
d'intégration de Gauss-Legendre : 113, 
116, 122 
d'intégration de Gauss-Tchebycheff : 136, 
138-140 
de Gauss-Seidel : 222, 223 
des pivots de : 70, 72, 74, 78 
Gibbs (phénomène de) : 238, 239 
Givens (méthode de) : 82 
Gödel : 19 
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gradient (méthode du gradient conjugué) : 
456 

Gram-Schmidt (orthogonalisation de) : 457 

grands nombres (loi des) : 301 

Greenberger (générateur de nombres 
pseudo-aléatoires) : 289, 290, 292, 294 


Hadamard (problème mal posé) : 273 

Hamilton (théorème de Cayley-) : 86 

hasard : 299, 300 

Heaviside (fonction d’) : 269 

Hermite (polynômes d’) : 153-155, 157, 159, 
162 

Héron : 427 

Hilbert : 76, 86 

histogramme : 352 

homogénéité des variances conditionnelles : 
364, 368, 369, 371-373, 376 

Horner (schéma de) : 411, 445 

Hospital (règle de l’) : 430 


Impulsion de Dirac : 439, 441 
incertitudes : 18, 21, 22 
indécidable (problème) : 19 
indépendance : 302, 303, 363 
inégalité de Bienaymé-Tchebycheff : 308, 309, 
480, 483 
infini (produit) : 403 
instabilité numérique : 58, 59, 61, 207, 273, 
294 
intégrale(s) 
de Fourier : 250, 252, 253 
de Fresnel : 48 
de Lebesgue : 253 
de Riemann : 253 
de Stieltjes : 306 
intégration numérique : 260 
intercorrélation : 437, 438 
interférences : 435 
interpolation 
formule 
de Bessel : 98, 100, 101 
de Lagrange : 101 
de Newton : 96, 97, 101 
de Stirling : 98, 100, 101 
par des fonctions spline : 101, 105 
inversion d’une matrice 
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par décomposition en matrices 
triangulaires : 72, 73, 78, 81, 82 
par la méthode des pivots : 453 
par une méthode de Monte-Carlo : 293 
trop volumineuse : 454 
isothermes d’un réfrigérateur : 465 
itération (généralités) : 23 


Jacobi 
méthode de : 86 
équations aux dérivées partielles : 222 
Jordan (théorème de) : 233, 234 


Kacmarz (méthode de) : 61, 62, 64, 452 

Kinchine (théorème de Wiener-\ : 436-438 

Kolmogorov (critère de) : 356 

Kronecker : 133 

Krylov (calcul des valeurs propres par la 
méthode de) : 86 

Kutta {méthode de Runge et) : 199, 201, 208, 
211, 212 


Lagrange 
formule de : 190 
multiplicateurs de : 278 
polynôme d’interpolation de : 90-92, 94, 96, 


100, 101, 106 
Laguerre 
polynômes : 141-145, 149, 150 


généralisés : 151, 152 
Laplace 
calcul des transformées : 149 
équation de : 216, 221 
loi de Gauss- : 311, 312, 316, 317 
produit de : 221, 229, 429 
Le Verrier (calcul des valeurs propres par la 
méthode de) : 79, 81 
Lebesgue (intégrale de) : 253 
Legendre (polynôme de) : 117, 119-121, 
123-195, 129 
Lehmer (générateur de nombres 
pseudo-aléatoires) : 289, 290, 292, 294 
Leibnitz (règle de dérivation de) : 115, 116, 
153-155 
Liouville-Neumann (série de) : 39, 41, 42 
Lipschitz : 196, 197, 200, 207, 210, 214 
lipschitzienne (fonction) : 196, 210 
lissage (filtrage) : 89, 229 


localisation des racines : 52 
logarithme (calcul de la fonction) : 425 
loi 
binomiale : 311-313, 315, 316 
négative : 474-476 
de Fisher-Snedecor : 489, 490 
de Gauss-Laplace : 311, 312, 316, 317 
de Poisson : 311-315 
de Student : 331, 339, 340 
de Weibull : 479 
des grands nombres : 301 
du y? : 331 
multinomiale ou polynomiale : 482, 483 


MacLaurin 
développement en série : 20, 113, 127, 137 
147, 402, 459, 495 
formule d’Euler- : 177 
série de : 21, 160 
Maehly (approximants de) : 405, 414, 416, 
418, 419 
maillage d’un domaine : 215, 217-219, 222, 
224-226 
mantisse : 21, 26, 28, 29 
Mathieu (équation de) : 462 
matrice 
de corrélation : 341, 346, 379 
de covariance : 346 
de Hilbert : 76, 86 
décomposition en matrices triangulaires : 
72, 73, 78, 81, 82 
définie positive : 111 
inverse : 69, 72, 78 
multiplication : 69, 70 
produit : 69, 72, 73, 82 
puissance : 81 
quasi triangulaire : 82-84 
trace : 81, 86 
transposée : 82 
triangulaire : 72, 73, 81, 82 
tridiagonale : 77 
unitaire : 73, 77, 78 
matriciel (epsilon-algorithme) : 37, 38 
Mayer : 287 
médiane : 307 
Mendéléev : 493 
méthode 
d’Adams : 200, 207, 209 


? 
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d’Adams-Bashforth : 201, 202, 212 
d'Adams-Moulton : 205, 213 
d’Euler : 464 
d'intégration de Gauss-Hermite : 153, 161 
de Choleski : 455 
de Cotes-Newton : 190 
de Cramer : 69 
de Danilevski : 84, 85 
de Gauss-Seidel : 222, 223 
de Givens : 82 
de Jacobi 
équations aux dérivées partielles : 222 
systèmes linéaires : 86 
de Kacmarz : 61, 62, 64, 452 
de Krylov : 86 
de Le Verrier : 79, 81 
de Monte-Carlo : 287, 292, 293 
de Newton : 58 
et des parties proportionnelles : 58, 59 
de Picard : 197, 210 
de prédiction-correction : 463 
de régularisation : 276, 280, 283 
de Richardson : 185 
de Romberg : 177, 184, 186 
de Runge et Kutta : 199, 201, 208, 211, 212 
de Rutishauser : 81-84, 86 
de Simpson : 188, 192 
de Souriau : 461 
de Taylor : 198, 200, 211 


de tir : 214 

des différentiations rétrogrades : 207, 208, 
213 

des moindres carrés : 89, 109, 110, 375, 376, 
454, 495 


des pivots de Gauss : 70, 72, 74, 78 
des rectangles : 186, 188 
des trapèzes : 184, 187, 188, 192 
du gradient conjugué : 456 
du recuit simulé : 287, 294 
minimum d’une fonction : 287, 294 
mode : 307 
modèle de Debye : 183 
moindres carrés (méthode des) : 89, 109, 110, 
375, 376, 454, 495 
Moivre (formule de) : 236 
moments 
centrés : 307 
non centrés : 307 
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Monge-Ampère (théorie de) : 216 
Monte-Carlo (méthodes) : 287, 292, 293 
Moulton (méthode d’Adams-) : 205, 213 
moyenne 

d’une fonction : 291 

d’une variable aléatoire : 307 
multiplicateurs de Lagrange : 278 


Nœud : 215, 217, 218, 222, 223 
Neumann 
conditions de : 216 
Liouville (série de) : 39, 41, 42 
Neville (calcul du polynôme d’interpolation) : 
107, 108 
Newton 
formule d’itération : 56-60 
méthode d'intégration de Cotes- : 190 
polynôme d’interpolation : 96-98, 101 
relation entre les coefficients et les §1 d’un 
polynôme : 79 
nombres 
d’or : 443 
de Bernoulli : 177-180, 183, 444 
loi des grands : 301 
pseudo-aléatoires à distribution 
exponentielle : 295 
gaussienne à queues soignées : 296, 297 
gaussienne ordinaire : 297 
rectangulaire : 288, 290, 293, 297 
sinusoïdale : 295 
représentation des : 17, 18, 20, 22, 27-30 
noyau : 274 


Opérateur 
de différences 
deuxièmes : 95, 97-99 
premières : 95, 97-99 
intégral : 275 
régularisant : 276, 277, 284 
ordre 
d’un processus itératif : 449-451, 455 
statistique : 471 
orthogonales (aux) 
fonctions : 390 
polynômes : 113, 121, 133, 134, 136, 141, 
143, 144, 153-155, 389, 390, 392-394 
orthogonalisation : 390, 392, 457 
orthonormé(e}s 
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polynômes : 114, 158 
oscillateur de Van der Pol : 462 
oscillation du pendule simple non linéarisé : 
195, 214 


Pacioli : 18 
Padé (approximants de) : 405, 407, 408, 411, 
414 
paramètre de régularisation : 276, 277, 280 
Parseval (théorème de) : 255-258 
Pearson (critère de) : 353 
peigne de Dirac : 438 
pendule 
de longueur variable (intégration) : 462 
équation du : 195, 214 
phénomène de Gibbs : 238, 239 
mr (calcul de) : 290 
Picard (méthode de) : 197, 210 
pivot 
de Gauss : 70, 72, 74, 78 
de la transformation de Danilevski : 84, 85 
Poincaré (développement asymptotique) : 45 
point de pourcentage : 367, 373 
Poisson 
distribution de : 313 
équation de : 216, 220, 221 
formule de : 271 
loi de : 311-315 
processus de : 314 
polynôme 
à coefficient principal réduit : 67, 93, 114, 
118, 134 
à coefficients complexes : 449, 450 
caractéristique : 79, 86 
d Hermite : 153-155, 157, 159, 162 
de Bernoulli : 177, 179, 181 
de Lagrange (interpolation) : 90-92, 94, 96, 
100, 101, 106 
de Laguerre : 141-145, 149, 150 
généralisé : 151, 152 
de Legendre : 117, 119-121, 123-125, 129 
de Tchebychef : 133-137, 139 
division par un monôme : 449 
division par un trinôme : 63 
interpolation 
ascendant de Newton : 98, 101 
de Bessel : 98, 100, 101 
de Stirling : 96, 98, 100, 101 


descendant de Newton : 97, 101 
racines d’un : 63 
à coefficients complexes : 67, 449, 450 
à coefficients réels : 67 
population parente : 351-353, 483, 486, 
489-491 
précision (sur les nombres) : 18, 22, 23, 26, 
29, 30 
prédiction-correction (méthode de) : 463 
probabilité : 299 
composée : 303 
conditionnelle : 303, 305 
convergence en : 301, 309 
densité de : 306-308 
totale : 303, 304 
problème 
bien posé : 274, 276 
de Buffon : 287, 288, 290 
de Dirichlet : 216 
de la poursuite : 465 
indécidable : 19 
mal posé : 273-276, 284 
raide : 207, 208 
procédé d’extrapolation de Richardson : 
31-35 
processus 
de Poisson : 314 
du deuxième ordre : 452 
du premier ordre : 452 
du troisième ordre : 512 
produit 
de convolution : 256, 257, 268, 284 
de deux matrices : 69, 72, 73, 81, 82 
de Laplace : 221, 229, 429 
infini : 403 
scalaire : 120, 159, 257, 456, 457 
profil d’une corde vibrante : 226 
prolongement analytique : 39, 40 
propagation 
de la chaleur : 216 
des erreurs : 22 
propres (valeurs) : 69, 72, 79, 81, 82, 84-86 
pseudo-aléatoires (nombres) : 287-290, 
292-297 
puissance d’un signal : 433, 434 
Pélya (urne de) : 474, 475 
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Quadratique (forme définie positive) : 82, 84 
quantile : 366, 367 
quasi triangulaire (matrice) : 82-84 


Racine 
carrée (calcul de la fonction) : 427 
localisation des : 52 
localisation des racines d’un polynôme 
à coefficients complexes : 67 
à coefficients réels : 67 
nombre de racines dans un intervalle 
(Sturm) : 383, 385-387 
raide (problème) : 207, 208 
rapport (de corrélation) : 373, 376 
recuit simulé (méthode du) : 287, 294 
récursivité : 264, 266 
réduites (fractions continues) : 399-402 
réfrigérateur (isothermes d’un) : 465 
refroidissement 
d’une plaque homogène : 225 
d’une sphère homogène : 467 
règle 
de d’Alembert : 44, 54 
de l'Hospital : 430 
de Leibnitz (dérivation) : 115, 116, 141, 
142, 151, 153-155 
régression 
coefficient de : 362, 492 
linéaire : 374, 376 
multilinéaire : 378 
régularisant (opérateur) : 276, 277, 284 
régularisation (paramètre de) : 276, 277, 280, 
283 
relations de Newton (coefficients d’un 
polynôme...) : 79-81 
répartition (fonction de) : 305-307 
réponse impulsionnelle : 439 
représentation des nombres en machine : 18, 
25-27 
résidu d'observation : 278, 280, 282, 283, 285, 
362-364 
rétrograde (méthode des différentiations) : 
207, 208, 213 
Richardson 
méthode de : 185 
procédé d’extrapolation de : 31-35 
Riemann 
fonction € de : 444, 445 
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intégrales de : 253 

robuste : 370 

Rodriguès (formule de) : 115-117, 141, 157, 
189 

Rolle (théorème de) : 54, 92, 117 

Romberg (méthode de) : 177, 184, 186 

Rothe : 19 

Routh (schéma de) : 386 

Ruffini : 19 

Runge (méthode de Runge et Kutta) : 199, 
201, 208, 211, 212 

Rutishauser (méthode de) : 81-84, 86 


Scalaire (epsilon-algorithme) : 35, 38, 39 
schéma 
de Bernoulli : 311 
de Horner : 411, 445 
de Routh : 386 
Schmidt 
orthogonalisation de : 390 
orthogonalisation de Gram- : 457 
séculaire (équation) : 79 
Seidel (méthode de Gauss-) : 222, 223 
série 
asymptotique : 45-48 
de Fourier : 229, 232-235, 238, 241, 244, 246 
de Liouville-Neumann : 39, 41, 42 
de MacLaurin : 20, 21, 113, 127, 137, 160, 
402, 459, 495 
de Taylor : 20, 123, 127, 137, 160, 198, 200, 
211, 445, 450 
développement en série de polynômes : 120 
entière : 17, 20, 21, 203, 401 
seuil : 354, 355, 373, 374 
Shannon 
fréquence de : 268 
interpolation de : 268 
signal : 433, 435 
Simpson 
formule de : 463 
méthode de : 188, 192 
sinus (calcul de la fonction) : 423 
sinus intégral (fonction) : 47 
Snedecor (loi de Fisher-) : 489, 490 
Sobolev : 279, 280 
solubilité du nitrate de sodium dans l’eau : 
493 
solution de Weber : 430 
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somme 
. des puissances semblables des racines d’un 
polynôme : 79, 81 
formule de la : 177, 180 
source de chaleur : 467 
Souriau (méthode de) : 461 
spectre 
continu : 250 
de bande : 250 
spectroscopie (mesure d’une température) : 
493 
spline (fonction) : 101, 102, 105 
stabilité (condition) : 224, 226 
statistiques (caractéristiques) : 299-301 
Stieltjes (intégrale de) : 306 
Stirling 
formule de : 316 
polynôme d'interpolation de : 96, 98, 100, 
101 
stochastique : 364-366 
Stokes : 45 
Student 
loi de : 331, 339, 340 
W. Gosset : 336, 339 
Sturm 
suites de : 383-386 
théorème de : 383, 385 
suites 
de Sturm : 383-386 
numériques (variation des} : 383 
test des - ascendantes et descendantes : 365 
systèmes 
linéaires 
choix des pivots : 85 
méthode de Jacobi : 86 
méthode de résolution : 69, 70, 72, 73, 76 
volumineux : 454 
non linéaires, méthode de résolution : 450, 
451 
surdéterminés : 86, 110, 378, 454, 485 


Tableau des différences : 96, 412, 418 
taille de l’échantillon : 368, 489 
tangente 
calcul de la fonction : 425 
commune à deux courbes : 446 
Tartaglia : 18 


Taylor (développement en série de) : 20, 123, 
127, 137, 160, 198, 200, 211, 445, 450 
Tchebycheff : 308, 309 
intégration de Gauss- : 113, 116, 122-124, 
129, 136, 138-140 
polynôme de : 133-136 
température (mesure par spectroscopie) : 493 
test 
d’hypothèse : 351 
de pile ou face : 299, 300, 302 
des suites ascendantes et descendantes : 365 
théorème 
d’Arzelà : 196, 197 
d’échantillonnage : 263 
de Bernoulli : 301, 308, 309 
de Cauchy : 445, 473 
de Cauchy-Lipschitz : 
210, 214 
de Cayley-Hamilton : 86 
de Jordan : 233, 234 
de Padé : 407 
de Parseval : 255-258 
de Rolle : 54, 92, 117 
de Sturm : 383 
de Weierstrass : 90, 123, 235, 391 
de Wiener-Kinchine : 436-438 
des probabilités composées : 303 
des probabilités totales : 303, 304 
suites de Sturm : 385 
théorie de Monge-Ampère : 216 
Tikhonov : 273 
tir (méthode de) : 214 
trace d’une matrice : 81, 86 
transcendante (équation) : 51 
transfert thermique : 224 
transformations 
de Fourier : 237, 241, 242, 246, 249, 
251-255, 257, 260, 262, 263, 266, 271 
de Jacobi : 86 
orthogonales : 548 
unitaires : 82 
transformées de Laplace (calcul des) : 149 
transitoire (étude d’un phénomène) : 463 
trapèzes 
formules des : 182 
méthode des : 184, 187, 188, 192 
triangulaire (décomposition des matrices) : 
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